在上学期的课程中,我们的任务是对修改后的llama2.c项目(移除了kv-cache和编译器优化)进行优化。因为这个项目强制按组分配,所以我没有机会完整的从头来编写并优化LLM的推理引擎。因此在这里尝试手动从头使用CPU,Naive CUDA Kernel,写一个Qwen的推理引擎。 在这里我们首先
目前我已经将原先运行在Racknerd上的Halo博客服务迁移到了本地的机器。 机器是春节回国的时候,从国内拿回来的。是一个G3900的mini-PC,我换了风扇,手动加上了16G内存条,256G的SSD。硬盘是外接的双盘位硬盘盒。 瑞典这里公寓的价格包含了电费,同时也有上下行对等的1000M宽度,
岁末年关,转眼间又到了2025年底,想起来去年的此时还在边上班边打游戏边等着录取的结果,而现在已经一个人在瑞典边复习边总结,实在是有恍如隔世之感。2025年也注定是我人生中难以忘却的一年,可能到我临死前也仍然会想起今年吧。 痛苦 人是会不断欺骗自己,告诉自己事情还会好的动物,而到了自己也无法欺骗自己
本文转载自知乎文章:https://zhuanlan.zhihu.com/p/1943448465209292428 折叠时空—压缩现代性下的中国 写在最前面: 在深入分析之前,我们必须明确一个核心的研究方法论。与可以进行个性化精神分析的个体心理不同,群体心理的研究,始于一个看似反常识却至关重要的前
Instruction Scheduling Techniques Statically Scheduled Pipelines Out-of-order Instruction Completion In the 5-stage pipeline all instructions start an
不知不觉快来瑞典两个月了,也即将迎来第一个period的考试。相比于刚来时候的轻松闲适,生活也逐渐加紧了。 前两天,因为瑞典很低的行政效率,我仍在等待自己的ID卡;因为没有ID卡,且还没收到eduID的认证邮件,我无法查看自己的考试时间,所以一直误以为马上就要考试了;再加上自己对未来的恐慌,实验队友
2025年8月21日,我打包好行李,在阴雨连绵的下午到了北京朝阳站,从朝阳站拎着50kg的行李上了网约车,直奔首都机场T3。 这是我第一次来北京的机场,因为距离原因,之前到北京都是走铁路。首都机场T3给我一种既老旧又发达的感觉,在里面花了60多吃了一碗面,这是我出发瑞典之前在国内吃的最后一顿堂食了,
事情起因 6月29日在使用电脑的过程中,发现MacBook Pro的屏幕边缘莫名其妙出现的了彩色的暗影条纹,呈回字形,屏幕右侧和下侧较为明显。 在发现这个状况后,我下意识的认为这是一个硬件问题。我还清楚的记得我特意截了一张图,是没有这个显示的。于是我当天下午就预约好了天才吧去检测。 到了天才吧,工作