实验 7：综合实验

1 实验目的

学习 OS 在硬件层面的抽象
完善自己的 CPU Core，运行起一个简易 ELF 程序：Naive Kernel

2 实验环境

HDL：Verilog
IDE：Vivado
开发板：Nexys A7
软件辅助环境：Ubuntu 20.04, 22.04

3 背景介绍

在系统二贯通课程的学习中，我们既学习了硬件系统（体系结构）也学习了软件系统（操作系统）。在这最后一个实验中，我们要尝试将一个简易的 32 位 ELF 程序：Naive Kernel 运行在自己编写的 CPU Core 上。

Naive Kernel代码，实现的功能类似于lab6中的内容，初始化多个进程，待时间片耗尽后进行调度，在基础要求中只会发生调度导致的异常，按照lab6中的调度逻辑trap_handler -> traps -> schedule -> switch_to -> __switch_to顺序执行。

为了降低实验难度，Naive Kernel 并不能算得上一个真正的操作系统，比如：

Naive Kernel 只有一个特权态（Machine Mode）
Naive Kernel 的中断栈是每个进程自己维护的
Naive Kernel 进程出让时间片的方式是自己减少进程特有的 Counter，而并不是通过外部的时钟中断
...

Naive Kernel 不使用串口或其他协议与外界通信，而是使用 gp 寄存器来标志当前的运行状态：

当进程切换后，gp 的值更新为 0x100 + task-id
当处理了 unimp 指令带来的 Illegal Instruction 异常后，gp 的值更新为 mcause 的值（进阶版）

4 实验步骤

首先需要清楚，本次的实验的主要工作是基于我们在 lab2 中完成的流水线 CPU 进行的。

4.1 准备工作

首先从仓库中同步如下代码

lab7
├── kernel
│   ├── Makefile
│   ├── build-advance
│   │   ├── head.o
│   │   ├── kernel.bin
│   │   ├── kernel.coe
│   │   ├── kernel.dump
│   │   ├── kernel.elf
│   │   ├── kernel.sim
│   │   ├── main.o
│   │   └── sim.elf
│   ├── build-normal
│   │   ├── head.o
│   │   ├── kernel.bin
│   │   ├── kernel.coe
│   │   ├── kernel.dump
│   │   ├── kernel.elf
│   │   ├── kernel.sim
│   │   ├── main.o
│   │   └── sim.elf
│   ├── head.S
│   ├── kernel.lds
│   ├── main.c
│   ├── main.h
│   └── sim.lds
└── memory
    ├── myRam.v
    └── myRom.v

在 lab7 下有两个子文件夹，其中 memory 是要添加在 Vivado 工程中的 .v 文件，kernel 则是要运行在我们自己编写的 CPU Core 上的程序

memory/myRom.v 文件的内容如下所示，注意，引用kernel.sim时，路径替换为你本机的文件绝对路径，使用/作为分隔符。

module myRom(
    input [10:0] address,
    output [31:0] out
);
    reg [31:0] rom [0:2047];

    localparam FILE_PATH = "kernel.sim"; // 修改为你的 kernel.sim 的路径
    initial begin
        $readmemh(FILE_PATH, rom);
    end

    assign out = rom[address];
endmodule

请在工程的适当位置添加如下代码，用于将 myRom 实例化，并将原来的用 Block Memory Generator 生成的 IP 核的实例化代码注释掉。

    myRom rom_unit(
        .address(pc_out[12:2]),
        .out(inst)
    );

除此之外，请仿照上述过程将 memory/myRam.v 也添加到项目中。

而在 kernel 文件夹下 build-advance 和 build-normal 分别是做 bonus 和不做 bonus 编译出的文件。请将 build-normal 目录下的 kernel.sim 加载到程序中，而相应的汇编文件我们可以查看 kernel.dump

而 head.S, main.c, main.h 则是程序的源代码，请同学们在实验开始前务理解源代码。

在编译得到的代码中可能会出现我们之前没有要求实现的指令，如 auipc，需要同学们根据实际情况在本次实验中补足，相应的指令请参考spec手册实现。

由于上板和 QEMU 调试 Naive Kernel 需要不同的内存起始地址（上板的地址从 0x0 开始，QEMU 调试的地址从 0x80000000 开始），我们通过 lds 文件控制了加载地址。在相应 build 文件夹下的 sim.elf 是供 QEMU 调试用的 ELF。

由于本次实验的代码量较大，调试起来会有一定难度，建议同学们在出现问题时从某一条或者某一类指令可能出错分析，一定要先确保要求实现的指令都可以正常执行，再跟踪波形调试。

4.2 QEMU 运行与调试

由于相应的工具链配置起来十分麻烦，因此我们已经帮大家做好了编译的工作，但是，我们仍然可以利用 QEMU 进行调试

Naive Kernel 不需要使用 OpenSBI 作为 Bootloader，因此在 QEMU 选项中使用 -bios 而非 -kernel 来加载 ELF 文件。因此为了调试 Naive Kernel，使用如下命令：

$ qemu-system-riscv32 -nographic -machine virt -bios path/to/sim.elf -S -s

其他流程均与之前的实验相似。

4.3 增加 CSR 寄存器

本次实验需要新增至少3个CSR寄存器：mtvec, mepc, mstatus，以保证程序的正确执行。CSR寄存器的长度为 MXLEN-bit ，在本次实验中取 MXLEN 的值为 32。我们推荐将CSR寄存器封装在一个独立的CSR模块（module）中，将实现的CSR寄存器通过接口与流水线CPU进行交互。

下面是3个寄存器的简要介绍，我们在实验中只要求实现某些寄存器的部分功能，如果想要了解完整的处理机制可以参考官方手册。

mtvec(Machine Trap-Vector Base-Address Register)寄存器是可读可写寄存器，存储异常处理代码的地址，本次实验只需要实现Direct模式，即发生异常时跳转到mtvec所指向的地址进行处理。
mepc(Machine Exception Program Counter)寄存器是可读可写寄存器，存储发生异常时的地址。
mstatus(Machine Status Register)寄存器是可读可写寄存器，存储M模式下的异常相关的信息，在本次实验中我们只需要实现其中的MIE(3)即可。

4.4 增加特权态指令

csrr[w/s/c][i]是对于CSR寄存器进行读写操作的指令，这里以csrrw rd, csr, rs举例说明，csrrw的指令含义是Atomic Read/Write CSR，原子地读写CSR寄存器，即原子性地完成gpr[rd] = csr, csr = gpr[rs]一读一写两个操作。与之相类似，csrrs即set操作gpr[rd] = csr, csr = csr | gpr[rs]，csrrc即clear操作gpr[rd] = csr, csr = csr & ~gpr[rs]，[i]即为立即数指令，更多相关的细节可以参考RISCV官网。
ecall指令的含义是向执行环境发出请求，我们在lab4~6中实现的sbi_ecall就是通过ecall向权限更高的M模式发送请求，完成类似于打印字符，设置时钟计时等。在本次实验中，我们只实现M模式，在执行指令ecall后会触发异常Environmrnt call from M-mode，需要对相关寄存器进行设置并跳转到异常处理地址。
mret指令的含义是从M模式的Trap下返回，在本次实验中，我们只实现M模式，因此无需考虑所处模式的变化，在执行指令mret后会从Trap中返回到正常的代码执行流中，即寄存器mepc所储存的地址。（请思考当发生异常和中断时，返回地址有什么区别）

提示：在 csrr[w/s/c][i] 指令中会出现数据冒险，这里推荐使用 stall 的方式处理相应的冒险。

4.5 增加异常处理逻辑

异常处理逻辑与控制跳转类似，相似点是以流水线内部的视角来看都是跳转到一个地址继续执行，只不过异常是跳转到mtvec寄存器所在的地址，不同之处在于CSR模块内部的处理，异常会导致相关的CSR寄存器状态发生变化。在本次实验中，我们只实现M模式，以及最基本的三个CSR寄存器，当发生ecall异常时，会导致mepc寄存器发生变化，当执行mret时，需要返回mepc所指向的地址。

这里要注意异常的机制设计，先思考好异常在哪个阶段判断，在异常发生时哪些指令应该被执行，哪些指令不该被执行，以及流水线的刷新，传递等问题。

CSR模块的基本功能是对CSR寄存器进行读写，需要的接口即为csr_write使能, addrCSR编号, din, dout数据端口。考虑到ecall命令执行时需要跳转到mtvec并将当前的pc写入mepc，因此还需要ecall信号端口，pc输入端口和mepc写端口，如果实现了高阶的功能则还需要增加mcause的写端口。

4.6 波形仿真调试

本次实验中我们将测试文件的指令数提升了若干倍，也使得调试难度增大了许多，我们给出以下几点参考建议：

推荐先理解程序的执行过程，再开始实验，由于 COUNTER_INIT 的值较大，因此波形可能会很长，可以在仿真时将 Vivado 中指定运行时间增加到一个较大的值，如 10,000 us，然后每次运行相应的时间，关注 gp 寄存器的值是否如预期的变化。
实验中csr[c/s/w]指令较少，在调试时可以先关注_start函数中该指令的正确性。
在调试时可以手动跟踪第一次由task0切换到task1的全过程，这个过程不算特别长，可以手动查看执行流与关键寄存器的值，这里比较重要的寄存器是a5，在执行到函数proc中时，a5寄存器存储的是current->counter，可以通过a5的变化大致观察到程序运行过程。确保上述过程正确后再添加gp寄存器查看，gp寄存器存储的是0x100 + task_id，观察是否是从小到大循环变化，即可验证仿真是否通过。
实现时需要同学们考虑RAM的大小问题，本次实验的数据段地址位于[0x500, 0x500 + 0x100 * task_id]，需要扩大RAM的大小，请同学们调整好相关的宽度问题。
注意在进程第一次被调度时不会修改gp的值。

5 实验步骤（进阶）

5.1 准备工作

将 kernel.sim 换成 build-advance 下的文件即可。进阶版在counter = 0x555时会执行一条未定义指令，触发异常后kernel会通过软件将gp的值改写为mcause的值，即不需要通过硬件实现这一要求，只需要实现新增的CSR寄存器和异常判断逻辑即可。

5.2 增加 CSR 寄存器

mcause(Machine Cause Register)寄存器保存了发生异常的原因，当发生了变化为M模式处理的异常时，mcause寄存器应当写入发生异常的原因，在privileged手册中可以查看RISCV对不同的Interrupt和Exception规定的编号。

5.3 增加异常处理逻辑

illegal instruction：当读取到非法指令时，触发该异常，跳转至mtvec，保存mepc和mcause。

6 验收与提交要求

需要注意的是，本次作业是硬件实验，因此需要验收。验收时请将 gp 寄存器和 pc 的值输出到板子上，方便我们查看。而在学在浙大上的提交与之前硬件实验一致只需要实验报告即可，无需提交代码。验收的两种要求如下

基本要求：实现M特权态，增加指令ecall, mret, csr/[s/w/c/]，增加CSR寄存器mtvec, mepc, mstatus，实现异常机制（可以拿到全部分数）
高阶要求：编译运行ADVANCE kernel，增加CSR寄存器mcause，增加illegal instruction异常（可以拿到全部分数和额外的 bonus）

由于疫情原因，本次的验收将会采用线上验收的方式进行，大家私戳任何一位助教即可，具体要求如下：

首先说明你是否做了 bonus ，然后拍摄上板的视频，开启连续运行模式（即将 switch[15] 拨上去），首先展示 pc 的变化情况（大概十几秒），然后停止连续运行模式并按下 reset 键，控制板子输出 gp 寄存器的值，再开启连续运行模式，展示 gp 寄存器变化的情况（大概十几秒）。上板视频到此结束
然后请录制一个讲解代码实现的视频，请使用相应的录屏软件录制自己的屏幕（请不要使用手机拍摄电脑屏幕），并结合自己的代码讲讲自己的大致实现过程（也可以通过画图的方式辅助讲解）。请保证自己的讲解清楚且完整，否则我们可能会通过语音通话并要求共享屏幕的方式进行提问。
如果实在没有录制条件，也可把自己的代码截图发给我们，我们会针对你的代码进行相应的提问，如果能准确且及时的回答出问题即可通过验收。

除此之外，再次提醒实验报告中需要对仿真的结果进行截图并作以简要的说明，否则可能会被扣去相应的分数