docs(lab5): add boweraccess docs

ToolmanP · ToolmanP · commit 90a02e2da30d · 2025-04-15T16:29:59.000+08:00
Signed-off-by: Yiyang Wu &lt;toolmanp@tlmp.cc&gt;
diff --git a/Pages/Lab5/assets/example.jpg b/Pages/Lab5/assets/example.jpg
diff --git a/Pages/Lab5/base.md b/Pages/Lab5/base.md
@@ -44,7 +44,7 @@ struct fs_vnode {
 
 FS_Base 的 IPC handler 在处理 IPC 请求时，会先把 IPC 消息中包含的文件 fd 转换为 fid，所以我们需要把进程的 fd 和实际所对应的文件表项的映射建立起来，而在 ChCore 中对应的就是 `server_mapping` 链表。每当处理 IPC 请求时，文件系统都会通过进程发起的 badge 号找到与之对应的映射表，最终得到文件表项的 ID。
 
-> [!CODING] 练习5
+> [!CODING] 练习题 5
 > 实现 `user/system-services/system-servers/fs_base/fs_wrapper.c` 中的 `fs_wrapper_set_server_entry` 和 `fs_wrapper_get_server_entry` 函数。
 
 > [!HINT] Tip
@@ -69,7 +69,7 @@ FS_Base 的 IPC handler 在处理 IPC 请求时，会先把 IPC 消息中包含
 
 针对 mmap 操作，我们知道针对文件的 mmap 操作是采取 Demand Paging 的内存映射来实现的，当用户进程调用 `mmap` 时，FS 会首先为用户新增一个 `pmo` 即内存对象，并将其对应的类型设置为 `PMO_FILE`，并为其创建 `Page_Fault` 映射(`user/system-services/system-servers/fs_base/fs_page_fault.c`)，最后将该 `pmo` 对象发回用户进程并让其进行映射。当用户尝试访问该内存对象，并发生缺页异常时，内核会根据 pmo 的所有者(badge)将异常地址调用到对应FS处理函数进行处理，处理函数为每一个文件系统中的 `user_fault_handler`，此时 FS 服务器会根据缺页地址分配新的内存页，填充文件内容并完成缺页的处理，最终返回内核态，从而递交控制权到原来的用户进程。
 
-> [!CODING] 练习6
+> [!CODING] 练习题 6
 > 实现 `user/system-services/system-servers/fs_base/fs_wrapper_ops.c` 中的 `fs_wrapper_open`、`fs_wrapper_close`、`__fs_wrapper_read_core`、`__fs_wrapper_write_core`, `fs_wrapper_lseek`函数。
 
 > [!HINT] Tip
@@ -81,9 +81,9 @@ FS_Base 的 IPC handler 在处理 IPC 请求时，会先把 IPC 消息中包含
 > - 你应当回顾 Lab2 的代码，去了解针对 PMO_FILE，内核是怎么处理缺页并将其转发到FS中的。同时你需要查看 `user/system-services/system-servers/fs_base/fs_page_fault.c` 中的 `page_fault` 处理函数，了解 FS 是如何处理 mmap 缺页异常的。
 
 > [!SUCCESS]
-> 完成练习6后，执行 `make grade`，可以得到 `Scores: 100/100`。
+> 完成练习题6后，执行 `make grade`，可以得到 `Scores: 100/100`。
 
-> [!QUESTION] 练习7
+> [!QUESTION] 思考题 7
 > 思考 ChCore 当前实现 VFS 的方式有何利弊？如果让你在微内核操作系统上实现 VFS 抽象，你会如何实现？
 
 ---
diff --git a/Pages/Lab5/bower.md b/Pages/Lab5/bower.md
@@ -0,0 +1,102 @@
+# BowerAccess
+
+
+> [!NOTE]
+> large language models (LLMs) 在当今时代快速发展，成为新一代科技发展创新浪潮的热点。
+>
+> LLMs 通常具有数以亿计甚至数以百亿计的参数，这使得它们能够捕获语言中的复杂模式和语义关系，但也引入了极高的内存资源开销。以 GPT-3 举例，它的参数量为 175B，在未经优化的条件下，它的运行时内存开销大于 700GB 。这远远超出了许多边缘设备的 GPU 显存大小（如树莓派 4b 的 GPU 显存大小为 2GB）。
+>
+> PowerInfer 是发表在 SOSP'24 上的工作，它可以使得 175B 的 LLM 部署在单个商用级 GPU 上，这得益于它观察到了 LLM 访存的稀疏性。即在 LLM 中，并不是所有的神经元都对于计算结果有影响，只有少部分神经元会影响最终的结果，通过只将重要的神经元加载到 GPU 显存中，并选择性地对神经元进行计算，来减少 LLM 的运行时内存开销。
+
+> [!WARNING]
+> 这是一个我们制作的新Lab， 欢迎大家测试并提出意见。
+
+在 BowerAccess Lab 中，我们希望你参考 PowerInfer 的思想修改 chcore，进而在其上部署并优化一个与 LLM 类似的应用程序 `llm`（你可以在shell中通过`./llm`进行访问）。具体而言：
+
+`llm` 是一个 CPU 内存开销极大的程序，它会使用 `mmap()` 映射一个 1MB 大小的**特殊内存空间**（用 `MAP_LLM` 进行标识）并访问其中的数据完成功能，这远远超过了 chcore 管理的 `MAP_LLM` 物理内存大小（出于题目设计考虑，我们将这种特殊内存空间的大小限制为 1MB），直接运行会产生大量的 Page Fault，引入了极大的运行时开销。
+
+幸运的是，`llm` 的访存具有和 LLM 类似的稀疏性：
+
+- 它虽然映射了非常大的内存空间，但是只会访问其中的一个特定的内存页面子集
+
+- 只会按照单调递增的顺序访问内存页面
+
+`llm` 的 `mmap()` 会传递一个特殊的特殊的 `MAP_LLM` 参数。
+
+`llm` 的访存模式与下图相似（但访问的页面并不相同）：
+
+![example](assets/example.jpg)
+
+虽然程序总共映射了 9 个页面，但是只访问了 `0, 2, 5, 6, 8` 这几个页面，且一定按照 `0 -> 2 -> 5 -> 6 -> 8` 的顺序访问，并没有访问 `1, 3, 4, 7` 这几个页面。
+
+它的代码是（再次强调它只是示例代码，和真实的 `llm` 代码相似但不同）：
+
+```c
+#include <stdio.h>
+#include <stdlib.h>
+#include <fcntl.h>
+#include <sys/mman.h>
+#include <unistd.h>
+
+#define PAGE_SIZE 4096
+
+int main() {
+    const char *filename = "weight.dat";
+    int fd = open(filename, O_RDWR | O_CREAT, 0666);
+    if (fd < 0) {
+        perror("open");
+        return EXIT_FAILURE;
+    }
+
+    // alloc 9 pages
+    if (ftruncate(fd, 9 * PAGE_SIZE) == -1) {
+        perror("ftruncate");
+        close(fd);
+        return EXIT_FAILURE;
+    }
+
+    // map the file, use the special `MAP_LLM` flag
+    char *map = mmap(NULL, 9 * PAGE_SIZE, PROT_READ | PROT_WRITE, MAP_SHARED | MAP_LLM, fd, 0);
+    if (map == MAP_FAILED) {
+        perror("mmap");
+        close(fd);
+        return EXIT_FAILURE;
+    }
+
+    // access page 0, 2, 5, 6, 8
+    int pages_to_access[] = {0, 2, 5, 6, 8};
+    for (size_t i = 0; i < sizeof(pages_to_access) / sizeof(pages_to_access[0]); i++) {
+        int page_number = pages_to_access[i];
+        map[page_number * PAGE_SIZE] = 'A' + page_number; 
+        printf("Accessed page %d, first byte: %c\n", page_number, map[page_number * PAGE_SIZE]);
+    }
+
+    if (munmap(map, 9 * PAGE_SIZE) == -1) {
+        perror("munmap");
+    }
+
+    close(fd);
+    return EXIT_SUCCESS;
+}
+```
+
+根据 `llm` 所具有的**稀疏的、可预测的**访存模式，我们可以设计在 page fault 发生时，预取（prefetch）即将访存的多个页面，这样就可以减少 page fault 的次数，提高了运行性能。
+
+
+> [!WARNING]
+> 我们只提供 `llm` 的二进制文件，并不提供源码文件。请自由发挥，判断出 `llm` 的具体访存模式。
+
+> [!QUESTION] 思考题 8  
+>  阅读 `kernel/object/user_fault.c` 下的 `sys_user_fault_map_batched` 函数，并回答如下问题
+>  -  “`MAP_LLM` 地址空间具有容量限制”这个特点在代码中是如何实现的？
+>  - 对比它和 `sys_user_fault_map` 函数的区别，并回答我们为什么需要引入一个新的系统调用？
+
+> [!CODING]  练习题 9  
+> 为了实现在 page fault 的时候预取页面的功能，我们需要修改 `user/system-services/system-servers/fs_base/fs_page_fault.c` 文件：
+>   - 实现 `predict_prefetch_pages` 函数。
+>   - 实现 `handle_one_fault` 函数中针对 `MAP_LLM` 的预取（prefetch）功能，实现需要 `predict_prefetch_pages` 和 `usys_user_fault_map_batched` 函数的配合。
+
+---
+
+> [!SUCCESS]
+> 以上为Lab5的所有内容
diff --git a/Pages/Lab5/posix.md b/Pages/Lab5/posix.md
@@ -27,7 +27,7 @@ read(3, "", 131072)                     = 0
 
 撇去一些无关紧要的系统调用后，我们可以看到其首先调用了`openat`这个系统指令，其负责打开一个系统路径下的文件，并返回其一个文件描述符号。
 
-> [!CODING] 练习1
+> [!CODING] 练习题 1
 > 阅读 `user/chcore-libc/libchcore/porting/overrides/src/chcore-port/file.c` 的 `chcore_openat` 函数，分析 ChCore 是如何处理 `openat` 系统调用的，关注 IPC 的调用过程以及 IPC 请求的内容。
 
 Lab5 的所有代码都运行在用户态，不同应用间通过 IPC 进行通信，可调用的 IPC 相关函数定义在 `user/chcore-libc/libchcore/porting/overrides/include/chcore/ipc.h`。
diff --git a/Pages/SUMMARY.md b/Pages/SUMMARY.md
@@ -39,7 +39,7 @@
   - [Posix适配](./Lab5/posix.md)
   - [FSM](./Lab5/FSM.md)
   - [VFS(FS_Base)](./Lab5/base.md)
-
+  - [Boweraccess](./Lab5/bower.md)
 ---
 
 - [Detail: 源码详解](./Appendix/source-code.md)