分类: AI | Han's Blog

代码AI 未读

Cursor无限Max模型

本文介绍了一种通过修改Cursor客户端本地代码，将Claude 3.7模型的上下文窗口提升至200K的方法，从而实现类似Max版本的体验。具体做法包括：在`workbench.desktop.main.js`文件中修改`getEffectiveTokenLimit`函数，将返回值设为200000，实现所有模型或指定模型的上下文窗口扩展；修改`getModeThinkingLevel`函数，将思维深度设为最高；调整UI显示，使普通Claude 3.7模型在界面上显示为“MAX”并应用高亮样式。文章强调，这些更改仅影响本地客户端显示和行为，实际API调用和计费仍受Anthropic官方限制，无法绕过API密钥或服务器端的真实限制。最后提醒用户修改前做好备份，并注意这些更改不会改变Claude的底层功能。

逆向教程 AI 前端 2025-05-13

AI 未读

教育版中国区域限制解除办法

关于教育版的中国地区的删除可以通过修改前端方式来进行直接请求首先是地区的校验打开自己检查一下自己的学校在这里添加上，然后就能进行国内学校的检索 <option value="CN">China</option> 然后检索之后，确定你要申请的学校然后回到https://www.cursor.

逆向教程 2025-05-07

AI随笔未读

DeepSeek 开源 FlashMLA：高效 MLA 解码新时代

DeepSeek发布的FlashMLA是一款为Hopper GPU设计的高效多头潜在注意力解码内核。它支持BF16计算、采用分页KV缓存技术（块大小64），并在H800 GPU上实现了3000 GB/s内存带宽和580 TFLOPS计算性能。该项目主要优化变长序列推理，可显著降低显存占用和计算开销。FlashMLA的主要应用场景包括大语言模型推理、机器翻译、语音识别和推荐系统等领域。它能加速Transformer计算，提高推理吞吐量，优化长文本处理，降低延迟。该项目受到FlashAttention 2&3和CUTLASS的启发，是2025年AI计算优化领域的重要突破。项目已开源，开发者可通过简单的Python安装命令快速部署使用。这一技术创新将为依赖GPU计算的企业和开发者带来显著的性能提升，推动AI计算效率迈向新的高度。

深度学习资讯 Python AI 开源精神开源 2025-02-24