1 |
PyQt-Fluent-Widgets |
基于 PyQt5 的 Fluent Design 风格组件库。该库旨在提升Qt应用程序的视觉效果和用户体验,使其更现代化和美观。包含 250+ 开箱即用的组件,支持亮暗主题无缝切换和自定义主题色,搭配设计师,无需编写一行 QSS,只要拖拖拽拽,就能快速搭建现代化界面。 |
2 |
wenet |
一个端到端的语音识别解决方案。它旨在为研究人员和开发者提供一个灵活、高效的工具,用于构建和部署语音识别系统。特点: 支持多种语音识别模型架构 提供预训练模型和示例 支持Android、iOS等多平台部署 具有良好的文档和社区支持 持续更新和优化,跟进最新的语音识别技术 WeNet的设计目标是提供一个全面的语音识别工具包,既适用于研究目的,也适用于实际应用开发。它的灵活性和多平台支持使其能够满足各种语音识别需求,从简单的语音命令识别到复杂的大规模语音转录系统。 |
3 |
MinerU |
一个一站式、开源、高质量的数据提取工具,主要用于从PDF文档、网页和电子书中提取结构化数据。主要包含以下功能: Magic-PDF PDF文档提取 Magic-Doc 网页与电子书提取。MinerU的设计目标是提供一个全面的解决方案,用于处理各种类型的文档和网页内容,将非结构化数据转换为结构化和易于处理的格式。它特别适合需要处理大量文档、提取关键信息、或将不同格式的内容统一化的用户和组织。主要功能包含 支持多种前端模型输入 删除页眉、页脚、脚注、页码等元素 符合人类阅读顺序的排版格式 保留原文档的结构和格式,包括标题、段落、列表等 提取图像和表格并在markdown中展示 将公式转换成latex 乱码PDF自动识别并转换 支持cpu和gpu环境 支持windows/linux/mac平台 |
4 |
crawlee-python |
一个强大而灵活的工具,用于构建可靠的网络爬虫和数据提取系统。它支持从网站提取数据,下载HTML、PDF、JPG、PNG等文件,并可用于为AI、LLMs、RAG或GPTs等应用提供数据。特点: 支持HTTP和无头浏览器爬取 自动并行爬取 使用Python类型提示,提高开发体验 自动重试和错误处理 集成代理轮换和会话管理 可配置的请求路由 持久化URL队列 可插拔的数据存储系统 支持BeautifulSoup和Playwright 支持有头和无头模式 Crawlee-Python为开发者提供了一个全面的解决方案,可以处理从简单的HTML页面到复杂的JavaScript驱动的网站。它的设计目标是帮助开发者快速构建可靠的爬虫,同时提供足够的灵活性来应对各种网络抓取挑战。 |
5 |
rendercv |
简化简历创建和管理过程。它允许用户通过YAML文件管理简历内容,然后自动生成多种格式的输出,包括PDF、LaTeX、Markdown、HTML和PNG图片。RenderCV的优势在于它将简历内容与设计分离,简化了更新过程,并提供了比纯LaTeX更易于管理的解决方案。它特别适合那些希望精确控制简历格式和内容,同时又想避免直接处理复杂LaTeX代码的用户 |
6 |
reflex |
个用于用纯 Python 构建全栈 Web 应用程序的库。 它用于在几秒钟内创建高性能、可定制的 Web 应用程序。 Reflex 可用于通过单个命令部署 Web 应用程序。Reflex允许开发者使用纯Python代码来构建全栈Web应用程序。它的主要目标是简化Web开发流程,让Python开发者能够轻松创建交互式和响应式的Web应用。 使用场景: Reflex适用于多种Web应用开发场景,包括但不限于: 数据可视化仪表板 交互式Web应用 原型设计和快速应用开发 全栈Python项目 需要结合数据处理和Web界面的应用 特点: 使用纯Python代码:无需学习HTML、CSS或JavaScript 响应式设计:自动适应不同屏幕尺寸 状态管理:简化应用状态的处理 组件库:提供丰富的UI组件 热重载:支持开发时的实时更新 |