1.opendatalab / MinerU
简介:MinerU 是一个开源项目,旨在提供一个高效、灵活的数据挖掘平台。该项目由 opendatalab 组织维护,主要功能包括数据预处理、特征提取、模型训练和评估等。MinerU 支持多种数据格式和机器学习算法,适用于各种数据挖掘任务。通过模块化的设计,用户可以轻松集成和扩展功能,满足不同应用场景的需求。MinerU 还提供了丰富的文档和示例代码,帮助用户快速上手和使用。
Star:16801
Fork:1216
Today stars:1129
2.DataExpert-io / data-engineer-handbook
简介:DataExpert-io/data-engineer-handbook 是一个GitHub仓库,旨在为数据工程师提供全面的指南和资源。该仓库包含了数据工程领域的最佳实践、工具、技术和学习路径。内容涵盖了数据仓库、ETL流程、数据湖、数据管道、数据治理、数据质量管理等多个方面。此外,仓库还提供了实际案例和代码示例,帮助数据工程师更好地理解和应用这些技术。通过这个仓库,数据工程师可以系统地学习和提升自己的技能,从而在数据工程领域取得更好的职业发展。
Star:14040
Fork:2158
Today stars:985
3.dockur / macos
简介:OSX (macOS) inside a Docker container.
Star:8039
Fork:275
Today stars:526
4.microsoft / TinyTroupe
简介:TinyTroupe 是一个由微软开发的开源项目,旨在提供一个轻量级的、易于使用的工具集,帮助开发者在云原生环境中快速构建和部署微服务。该项目包含了一系列的模板、脚手架和实用工具,支持多种编程语言和框架,如 Python、Node.js 和 .NET。TinyTroupe 的目标是简化微服务的开发流程,提高开发效率,同时确保应用的高可用性和可扩展性。通过使用 TinyTroupe,开发者可以更专注于业务逻辑的实现,而不必过多关注底层的基础设施和部署细节。
Star:3120
Fork:181
Today stars:409
5.tursodatabase / libsql
简介:libsql 是一个开源的 SQL 数据库库,旨在提供一个轻量级、高性能的数据库解决方案。它支持标准的 SQL 查询语言,并且设计简洁,易于集成到各种应用程序中。libsql 特别适合需要快速数据存储和检索的场景,如嵌入式系统、移动应用和小型服务。该项目托管在 GitHub 上,由 tursodatabase 组织维护,提供了详细的文档和示例代码,帮助开发者快速上手和使用。
Star:11245
Fork:286
Today stars:297
6.TheBeastLT / torrentio-scraper
简介:torrentio-scraper 是一个用于从 Torrentio 网站抓取种子文件信息的 Python 脚本。该项目的主要功能是自动化获取和解析 Torrentio 上的种子数据,包括种子名称、大小、上传时间、种子健康度等信息。通过使用这个脚本,用户可以轻松地批量获取和分析种子数据,适用于需要大量种子信息的研究或应用场景。该项目依赖于 Python 的 requests 和 BeautifulSoup 库来实现网页抓取和解析。
Star:797
Fork:101
Today stars:280
7.blacklanternsecurity / bbot
简介:bbot 是一个开源的网络扫描工具,旨在自动化和加速渗透测试过程中的信息收集阶段。它支持多种扫描技术,包括子域名枚举、端口扫描、服务识别、漏洞扫描等。bbot 的设计目标是提供一个灵活且可扩展的平台,允许用户根据自己的需求定制扫描策略。它支持多种插件和模块,可以轻松集成其他工具和脚本,从而提高渗透测试的效率和准确性。bbot 还提供了详细的报告功能,帮助用户更好地分析和理解扫描结果。
Star:5505
Fork:458
Today stars:273
8.donnemartin / system-design-primer
简介:"system-design-primer" 是一个GitHub项目,旨在帮助开发者学习和理解系统设计的概念。项目内容包括系统设计的基本原则、常见问题的解决方案、面试准备指南以及大量的资源链接。它涵盖了从基础知识到高级设计的各个方面,适合不同层次的开发者使用。项目还提供了大量的代码示例、设计模式和实际案例分析,帮助用户更好地掌握系统设计的技巧和方法。通过这个项目,开发者可以系统地提升自己在系统设计方面的能力,为复杂系统的构建打下坚实的基础。
Star:275924
Fork:46329
Today stars:237
9.QwenLM / Qwen2.5-Coder
简介:Qwen2.5-Coder 是一个基于 Qwen 语言模型的代码生成工具,旨在通过自然语言处理技术自动生成高质量的代码。该项目利用先进的深度学习模型,能够理解复杂的编程任务,并生成相应的代码片段。Qwen2.5-Coder 支持多种编程语言,包括 Python、Java、C++ 等,适用于从简单的脚本编写到复杂的软件开发任务。通过提供直观的用户界面和强大的代码生成能力,Qwen2.5-Coder 旨在提高开发效率,减少手动编码的工作量。该项目在 GitHub 上开源,允许开发者自由使用、修改和贡献代码,推动代码生成技术的发展。
Star:2508
Fork:161
Today stars:177
10.haydenbleasel / next-forge
简介:next-forge 是一个基于 Next.js 的开源项目,旨在帮助开发者快速启动和配置 Next.js 项目。它提供了一系列预配置的工具和插件,包括 ESLint、Prettier、TypeScript 等,以简化开发流程。该项目还包含了一些常用的 Next.js 插件和配置,如 SWR、Tailwind CSS 等,使得开发者可以更快地搭建一个功能齐全的 Next.js 应用。通过使用 next-forge,开发者可以节省大量时间,专注于业务逻辑的实现,而不是项目的初始设置和配置。
Star:3584
Fork:283
Today stars:164