计算机系统实验笔记
lab1_challenge2 打印异常代码
直接make后的情况:
1spike ./obj/riscv-pke ./obj/app_errorline
12345678910In m_start, hartid:0HTIF is available!(Emulated) memory size: 2048 MBEnter supervisor mode...Application: ./obj/app_errorlineApplication program entry point (virtual address): 0x0000000081000000Switch to user mode...Going to hack the system by running privilege instructions.Illegal instruction!System is shutting down with exit code -1.
我们是希望本代码在第8行提示后显示runtime error,
内核能够输出触发异常的用户程序的源文件名和对应代码行
注意:虽然在 ...
LLM Self Defense
感想
这是之前看一篇比较水的文章,
主要是将LLM能够进行自我具备自我防御的能力.
感觉这篇文章idea很一般,所以读起来很轻松, 看之前的时候对越狱攻击没啥概念,
当时根据这篇文章里的一些想法尝试了自己设计一些prompt(结果当然是没有任何作用)所以当时还折腾了很久.算是精读过的一篇文章了.
在读这篇文章时,
偶然发现newbing虽然不能通过简单的方法进行越狱,但是却可以很轻松的"勾引"它输出有危害的网址,
截止2024年2月24日, 这个问题微软依然没有解决,
目前来说,这个想法也可以为当前的关于LLM越狱攻击的大创项目提供一些灵感.
这篇文章提到的方法其实比较有限, 内容也没多少, 感觉不如看那篇关于GCG
梯度攻击LLM的文章.
paper
url
author
date
LLM Self Defense: By Self Examination,
LLMs Know They Are Being Tricked
2308.07308.pdf
(arxiv.org)
Mansi
Ph ...
gitPage+vscode+hexo搭建简易博客
使用gitpages搭建简易网页
使用gitpages 单纯是因为它免费, 只需要在github上创建一个public仓库,
在仓库设置中启用gitpages功能就好了
githubpages的好处在于, 如果只是用于记录一些笔记,
甚至不需要使用jekyll、hexo和hugo之类的静态博客框架, 只需要会markdown,
就可以搭建一个非常简单的网页.
配合vscode使用
如果需要记笔记,难免需要使用图床来管理网页上的图片,
这里可以使用vscode来编辑md文件, 同时使用vscode
中的picgo功能,可以比较完美的解决图床的问题,
这里也可以使用github仓库作为免费图床,免费且方便。
使用博客框架hexo
如果想要美化自己的网站,就有必要考虑使用博客框架了,这里我使用了hexo。最后使用了butterfly的主题,
可以配合这里的教程使用Hexo中Buttefly主题配置(二)
- 知乎 (zhihu.com)
踩坑记录
搭建gitpages时,最好使用username.github.io的仓库名,
理论上其他名字的仓库也是完全 ...
综述:Survey of Vulnerabilities in Large Language Models Revealed by Adversarial Attacks
paper
url
author
date
Survey of Vulnerabilities in Large
Language Models Revealed by Adversarial Attacks1
[2310.10844] Survey of
Vulnerabilities in Large Language Models Revealed by Adversarial Attacks
(arxiv.org)
Erfan
Shayegani, Md
Abdullah Al Mamun, Yu
Fu, Pedram
Zaree, Yue
Dong, Nael
Abu-Ghazaleh
Mon, 16 Oct 2023
jailbreak attack
利用 “language modeling (pretraining)”, “instruction following”,
and “safety training” 三个阶段的目标不同
20240205132 ...