K.I.S.S---Keep IT Simple,Stupid!    人生苦短,我用Python
   Python开源项目周排行               2025年第1周 1. DeepSeek-Coder-V2 -- 一个开源的专家混合(MoE)代码语言模型,其在代码特定任务中的性能可与GPT4-Turbo相媲美。具体而言,DeepSeek-Coder-V2是在DeepSeek-V2的一个中间检查点上进一步预训练的,增加了6万亿个令牌。通过这种持续的预训练,DeepSeek-Coder-V2显著提升了DeepSeek-V2的编码和数学推理能力,同时在一般语言任务中保持了可比的性能。 2. awesome-deepseek-integration -- DeepSeek 实用集成.将 DeepSeek 大模型能力轻松接入各类软件。需要访问 DeepSeek 开放平台来获取您的 API key。 3. CS-Notes -- 技术面试必备基础知识、Leetcode、计算机操作系统、计算机网络、系统设计 4. ECommerceCrawlers -- 实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、招聘网站、闲鱼、阿里任务、scrapy博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评️️️。微信爬虫展示项目.通过每个项目的 readme,了解爬取过程分析。 5. plyr -- 一个开源的 HTML5 媒体播放器.Plyr 的主要用途是为网页提供一个现代化的、响应式的媒体播放器,支持视频和音频播放。它旨在替代传统的 HTML5 媒体元素,提供更好的用户体验和自定义选项。Plyr 支持多种格式,包括 YouTube 和 Vimeo 视频,使其成为多媒体网站的理想选择。 6. pex -- 这是一个开源的 Python 项目打包工具,专为跨环境部署和无法访问公网的部署场景设计。它能够将 Python 项目及其所有依赖,甚至是 Python 解释器(可选),打包成单个可执行文件(.pex),让开发者无需安装运行环境,即可直接运行 Python 程序,支持 Linux 和 macOS 系统。Pex 项目基于 PEP 441 的理念,旨在提供一种便捷的方式来创建可移植的 Python 环境。随着 Python 应用程序的普及,开发者需要一种简单的方法来打包和分发他们的应用,Pex 正是为满足这一需求而开发。
   Python开源项目月排行               2025年1月 1. hummingbot -- 开源软件,帮助您创建和部署高频加密交易机器人.Hummingbot是一个开源框架,帮助您设计和部署可以在许多集中式或去中心化交易所运行的自动交易策略或机器人。在过去的一年中,Hummingbot用户在140多个独特的交易场所上产生了超过340亿美元的交易量。Hummingbot 连接器标准化了不同类型交易所的 REST 和 WebSocket API 接口,使您能够构建复杂的交易策略,这些策略可以在多个交易所上以最小的更改进行部署。 2. minimind -- 2小时完全从0训练26M的小参数GPT!此开源项目旨在完全从0开始,仅用3块钱成本 + 2小时!(为防止误解,“2小时” 基于NVIDIA 3090硬件设备(单卡)测试,“3块钱” 指GPU服务器租用成本)即可训练出仅为25.8M的超小语言模型MiniMind。 MiniMind系列极其轻量,最小版本体积是 GPT-3 的 7000分之一 ,力求做到最普通的个人GPU也可快速训练。 项目同时开源了大模型的极简结构-包含拓展共享混合专家(MoE)、数据集清洗、预训练(Pretrain)、监督微调(SFT)、LoRA微调, 直接偏好强化学习(DPO)算法、模型蒸馏算法等全过程代码。 MiniMind同时拓展了视觉多模态的VLM: MiniMind-V。 项目所有核心算法代码均从0使用PyTorch原生重构!不依赖第三方库提供的抽象接口。 这不仅是大语言模型的全阶段开源复现,也是一个入门LLM的教程。 3. grok-1 -- Grok-1 的基础模型训练于 2023 年 10 月完成,标志着模型的预训练阶段结束。随后,xAI 于 2023 年 11 月 4 日将基于 Grok-1 的聊天机器人发布给 X Premium 用户,这被视为模型的首次公共可用性。2024 年 3 月 17 日,xAI 进一步开源了 Grok-1 的权重和架构,允许研究人员和开发者访问其技术细节。 4. keep -- 一个开源的 AIOps 和警报管理平台,旨在提供一个统一的界面(单窗格)来管理来自各种监控工具的警报。它利用 AI 技术进行警报去重、丰富、过滤和相关性分析,并支持可定制的工作流,帮助团队减少警报噪音,专注于关键问题。例如,它可以自动将严重警报转换为 Jira 工单,或通过 Slack 通知相关团队。平台还集成了多种工具,如 Anthropic、OpenAI、Datadog 和 Prometheus,适合需要高效警报管理的团队。例如,一个使用场景可能是:一家科技公司使用多个监控工具(如 Datadog 和 Sentry),每天收到数千个警报。通过 Keep,他们可以配置工作流自动将高严重性警报转换为 ServiceNow 工单,并通过 Slack 通知值班团队,同时 AI 相关性分析帮助识别重复警报,显著减少手动处理时间。 另一个场景是小型 Kubernetes 团队,他们可以使用 Keep 作为 Prometheus 警报的单窗格界面,通过简单的 Helm 安装快速上手,社区支持通过 Slack 提供。 5. agno -- 一个轻量级框架,旨在构建多模态智能体(Agents).Agno 的主要用途是帮助开发者快速构建和部署多模态智能体,适用于需要集成多种数据模态(如文本、图像、音频等)的应用场景。无论是构建聊天机器人、智能助手,还是其他需要多模态数据处理的人工智能应用,Agno 都能提供高效、简洁的解决方案。 6. OpenHands -- 原名 OpenDevin,是由 All-Hands-AI 组织开发的人工智能驱动的软件开发代理平台。该平台旨在通过 AI 技术增强软件开发流程,支持开发者执行从代码编写、命令行操作到网页浏览等多种任务,功能几乎与人类开发者相当。