标签: 开源 | Han's Blog

AI代码未读

本文记录了一个网盘内容自动化工具的技术实现。该工具旨在解决网盘资源整理与内容发布高度依赖人工的痛点，实现了从网盘链接提交、资源识别转存、分享链接生成、AI文章撰写到多平台发布的全链路自动化，并扩展支持了多链接合集、公众号文章改写与监听等功能。在技术架构上，项目采用FastAPI结合SQLAlchemy异步版与MySQL构建后端，前端使用Ant Design Pro，最终单体部署。系统采用清晰的分层架构：API层轻量路由，Service层负责业务编排，Repository层处理数据读写，同时抽象出Provider、Publisher和AI模块，以有效隔离不同网盘平台协议、发布渠道差异及AI接口调用。针对网盘转存、AI生成等耗时操作，系统设计了基于Pipeline的后台任务机制。用户提交任务后立即返回任务ID，系统通过asyncio在后台异步执行实际处理流程，前端通过轮询获取任务状态、进度与日志，从而避免HTTP请求超时，保障良好的用户体验。

开源精神开源建站代码 2026-05-13

AI代码未读

XHS Agent 开发博客：用 AI 自动化小红书内容运营的技术实践

XHS Agent 是一个面向小红书内容创作者的 AI 自动化运营工具。根据用户设定的运营目标，它能自动完成笔记文案生成、AI 配图（支持海报与真实照片两种风格）、参考图片素材管理、7 天发布计划制定，并通过 APScheduler 定时发布到账号，全程无需人工干预，同时支持 WxPusher 微信通知和多账号 Web 管理界面。项目核心采用多级 AI 编排流水线：第一阶段由 text_service 调用 LLM 生成标题、正文、标签，并决策图片风格；第二阶段 prompt_agent 从预设模板中优化提示词；第三阶段 image_service 负责生成图片。海报模式特别使用串行生成策略，将第一张图作为风格锚点，确保多张图片色调、排版高度一致；真实照片模式则直接并发以保留多样性。参考图片系统允许用户按风格、人物、产品、场景、品牌五类上传素材，由 GLM-4.6V 视觉模型自动标注，注入上下文以提升品牌贴合度。技术栈基于 FastAPI + aiosqlite 异步后端、React + Ant Design 前端、uv 包管理与 Docker 一键部署，精准解决人工运营中高频、高质、风格一致的痛点。

逆向 Python AI 开源代码 2026-02-24

AI代码未读

抖音数据分析MCP开发

Douyin MCP 是一个专为 AI 助手打造的本地化数据服务桥梁，通过 Model Context Protocol (MCP) 协议打破信息壁垒，赋予大模型直接检索和分析抖音海量数据的能力。该项目的核心突破在于摒弃了传统的高延迟外部签名服务器方案，巧妙利用 Python 嵌入式 V8 引擎（py-mini-racer）在本地进程内完全攻破了抖音最核心的 a_bogus 反爬虫防线，结合现代 Python 异步生态构建了一个高稳定、易部署的数据访问架构。

逆向 Python AI 开源 2026-02-02

AI随笔未读

DeepSeek 开源 FlashMLA：高效 MLA 解码新时代

DeepSeek发布的FlashMLA是一款为Hopper GPU设计的高效多头潜在注意力解码内核。它支持BF16计算、采用分页KV缓存技术（块大小64），并在H800 GPU上实现了3000 GB/s内存带宽和580 TFLOPS计算性能。该项目主要优化变长序列推理，可显著降低显存占用和计算开销。FlashMLA的主要应用场景包括大语言模型推理、机器翻译、语音识别和推荐系统等领域。它能加速Transformer计算，提高推理吞吐量，优化长文本处理，降低延迟。该项目受到FlashAttention 2&3和CUTLASS的启发，是2025年AI计算优化领域的重要突破。项目已开源，开发者可通过简单的Python安装命令快速部署使用。这一技术创新将为依赖GPU计算的企业和开发者带来显著的性能提升，推动AI计算效率迈向新的高度。

深度学习资讯 Python AI 开源精神开源 2025-02-24

随笔未读

DeepSeek 开源周：他们正在发布什么？

DeepSeek启动了为期五天的开源周活动，计划每天发布一个核心组件。目前已发布了Fire-Flyer AI-HPC研究论文和部分核心仓库。该论文介绍了一种软硬件协同设计框架，通过使用Fire-Flyer 2方案和10,000张PCIe A100 GPU，实现了接近DGX-A100的性能，同时将成本减半、能耗降低40%。论文还介绍了HFReduce通信优化技术，以及包含HaiScale、3FS和HAI-Platform的软件堆栈。在GitHub开源计划方面，DeepSeek已发布核心推理引擎和分布式训练框架两个仓库，未来三天将继续发布数据处理与预处理工具、模型微调与部署工具，以及完整推理系统与应用示例。DeepSeek选择开源的目的是降低AI研发门槛、促进知识共享、推动AI技术应用，希望通过社区协作推进AGI研究和工程发展。所有更新将在GitHub和Twitter(X)平台同步发布，欢迎开发者关注和参与。

资讯 AI 开源深度学习 2025-02-21

代码未读

Python爬虫 | 淘票票评论抓取

利用Python解密 sign及自动获取Cookies和Token的评论抓取实现背景：评论数据抓取的挑战淘票票作为一个知名的电影票务平台，其评论数据往往对用户公开，但为了防止未经授权的数据抓取，淘票票引入了多重反爬机制，比如sign加密、cookies验证以及复杂的token生成机制等。因此，实

开源 Python 逆向爬虫 2024-10-06

代码未读

云端部署GPT-SoVITS

简介 GPT-SoVITS-WebUI 强大的少样本语音转换与语音合成Web用户界面。

AI 开源 GPT-SoVITS 教程 2024-09-17

代码未读

如何优化 GitHub 上的前端 UI：以QAbot-zh/query-key项目为例

如何优化 GitHub 上的前端 UI：以 query-key 项目为例在软件和应用程序的开发过程中，前端用户界面（UI）是用户与产品交互的第一窗口。一个优秀的前端设计不仅可以提升用户体验，还能有效地传达应用的功能和价值。本篇博客将通过开源项目 QAbot-zh/query-key 的优化实例，探

建站开源前端 2024-09-14

随笔未读

我们为什么要开源?

我们为什么要开源？本文的题目就是一个问题，那么我们就按照思考问题的方式，使用学术三段论的方式对于“我们为什么要开源”进行分析，学术三段论指的是论文的正文由或明显或隐含的“三段论”方式来组织写作。我们选择“是什么——为什么——怎么办”这种方式来对问题进行分析。什么是开源首先明确一下，开源≠不商

开源开源精神 2024-09-09