XHS Agent 开发博客:用 AI 自动化小红书内容运营的技术实践
XHS Agent 是一个面向小红书内容创作者的 AI 自动化运营工具。根据用户设定的运营目标,它能自动完成笔记文案生成、AI 配图(支持海报与真实照片两种风格)、参考图片素材管理、7 天发布计划制定,并通过 APScheduler 定时发布到账号,全程无需人工干预,同时支持 WxPusher 微信通知和多账号 Web 管理界面。
项目核心采用多级 AI 编排流水线:第一阶段由 text_service 调用 LLM 生成标题、正文、标签,并决策图片风格;第二阶段 prompt_agent 从预设模板中优化提示词;第三阶段 image_service 负责生成图片。海报模式特别使用串行生成策略,将第一张图作为风格锚点,确保多张图片色调、排版高度一致;真实照片模式则直接并发以保留多样性。
参考图片系统允许用户按风格、人物、产品、场景、品牌五类上传素材,由 GLM-4.6V 视觉模型自动标注,注入上下文以提升品牌贴合度。技术栈基于 FastAPI + aiosqlite 异步后端、React + Ant Design 前端、uv 包管理与 Docker 一键部署,精准解决人工运营中高频、高质、风格一致的痛点。
攻克腾讯 TCaptcha 滑块验证码:纯 HTTP 协议逆向实战
本文记录了一次对腾讯 TCaptcha 滑块验证码的完整逆向工程实践,以粉笔教育登录流程为研究对象,目标是通过纯 HTTP 协议实现全自动化破解,不依赖 Selenium 或 Playwright 等浏览器自动化工具,最终实现 100% 通过率。
核心挑战包括:完整还原 TCaptcha 三阶段协议、优化 NCC 模板匹配算法计算拼图块亚像素级位置、高效求解 PoW 工作量证明,以及执行高度混淆的 TDC.js 虚拟机并仿真真实用户轨迹。
文章首先通过 HAR 抓包分析业务风控流程:发送短信接口触发 430 状态码返回 contextId,前端弹出腾讯验证码 iframe,用户验证后获取 ticket 和 randstr,提交 captcha/check 接口解除风控。验证码系统与业务系统解耦,可独立破解后提交凭证。
随后还原了前端 RSA/ECB/PKCS#1 v1.5 加密逻辑(手机号+时间戳),并用纯 Python 实现兼容的加密函数。
整体方案涵盖协议分析、图像处理、算法优化、PoW 求解和 JS 虚拟机执行等多环节,构建出一套稳定、可工程化的纯 HTTP 自动化破解解决方案。
抖音数据分析MCP开发
Douyin MCP 是一个专为 AI 助手打造的本地化数据服务桥梁,通过 Model Context Protocol (MCP) 协议打破信息壁垒,赋予大模型直接检索和分析抖音海量数据的能力。该项目的核心突破在于摒弃了传统的高延迟外部签名服务器方案,巧妙利用 Python 嵌入式 V8 引擎(py-mini-racer)在本地进程内完全攻破了抖音最核心的 a_bogus 反爬虫防线,结合现代 Python 异步生态构建了一个高稳定、易部署的数据访问架构。
DeepSeek 开源 FlashMLA:高效 MLA 解码新时代
DeepSeek发布的FlashMLA是一款为Hopper GPU设计的高效多头潜在注意力解码内核。它支持BF16计算、采用分页KV缓存技术(块大小64),并在H800 GPU上实现了3000 GB/s内存带宽和580 TFLOPS计算性能。该项目主要优化变长序列推理,可显著降低显存占用和计算开销。FlashMLA的主要应用场景包括大语言模型推理、机器翻译、语音识别和推荐系统等领域。它能加速Transformer计算,提高推理吞吐量,优化长文本处理,降低延迟。该项目受到FlashAttention 2&3和CUTLASS的启发,是2025年AI计算优化领域的重要突破。项目已开源,开发者可通过简单的Python安装命令快速部署使用。这一技术创新将为依赖GPU计算的企业和开发者带来显著的性能提升,推动AI计算效率迈向新的高度。
代码
未读
Python爬虫 | 淘票票评论抓取
利用Python解密 sign及自动获取Cookies和Token的评论抓取实现 背景:评论数据抓取的挑战 淘票票作为一个知名的电影票务平台,其评论数据往往对用户公开,但为了防止未经授权的数据抓取,淘票票引入了多重反爬机制,比如sign加密、cookies验证以及复杂的token生成机制等。因此,实