在过去的几年里,我们在职业编程环境中遇到了很多问题。工作的复杂性增加,编程任务变得更加复杂,而且需要长时间的专注和仔细的细节管理。我们时常涉足于代码编写、代码审查、代码调试和运行测试等多个步骤,这无疑增加了我们的工作强度。而且,我们通常需要在 shell、代码编辑器和网络浏览器等不同的工具之间切换,这使得任务变得极为繁琐。若能有个工具帮助我们解决一些看似复杂的编程任务,那将对我们大有裨益。

GitHub 开源项目 OpenDevin/OpenDevin,该项目在 GitHub 有超过 16.7k Star,一句话介绍该项目:OpenDevin: Code...

阅读更多

一个电动车充电治理与家庭能源管理系统

在全球范围内,电动汽车(EV)的快速增长与普及,为家庭充电和能源管理带来了前所未有的挑战和需求。用户经常面对的问题包括但不限于:如何有效管理电动车的充电以最大化利用家庭内部的太阳能电力、如何在电网负荷较低时优先充电以减少能源成本、同时如何确保充电过程的安全性和效率等。针对这些日益复杂的需求,一个能够综合解决上述问题的系统应运而生。

GitHub 开源项目 evcc-io/evcc,该项目在 GitHub 有超过 2.6k Star,一个电动车充电治理与家庭能源管理系统。

阅读更多

开箱即用,基于大模型的知识库问答系统

在当今信息化迅速发展的社会,企业和个人面临的信息量越来越庞大,如何快速从这些信息中提取所需的知识变成了一个重大的挑战。特别是对于那些需要快速响应客户查询、提供在线帮助或内部知识共享的企业来说,有效管理和检索大量的文档信息成了他们亟待解决的痛点。传统的文档管理和检索系统往往无法有效处理自然语言查询,且难以灵活地整合到第三方业务系统中,从而影响了运营效率和用户体验。

GitHub 开源项目 1Panel-dev/MaxKB,该项目在 GitHub 有超过 2.8k Star,一句话介绍该项目:基于 LLM 大语言模型的知识库问答系统。开箱即用,支持快速嵌入到第三方业务系统,1Panel...

阅读更多

多模态视觉语言模型 Mini-Gemini

随着大数据和人工智能技术的快速发展,多模态视觉语言模型(Multi-modality Vision Language Models)已成为近年来研究的热点。这类模型通过融合图像和文本信息,能够更好地理解和生成复杂的视觉语言内容,广泛应用于图像标注、视觉问答、内容生成等领域。然而,开发和训练这类高效、精确且可扩展的多模态模型仍面临巨大挑战,包括如何处理不同模态间的复杂交互、如何提高模型的理解和生成能力、以及如何处理巨大的模型尺寸和计算成本等问题。

GitHub 开源项目 dvlab-research/MiniGemini,该项目在 GitHub 有超过 2.5k...

阅读更多

用 SQLite 重塑 Redis 的技术革新

在日益复杂的数据处理场景中,Redis 以其高性能和灵活性被广泛应用于缓存、消息队列等多个领域。然而,随着数据量的激增,单纯依赖内存的存储方式暴露出一些短板,例如数据持久化、事务支持等方面的需求越来越强烈。尤其是对于小型团队或者项目来说,寻求一种低成本、易维护同时能够提供类似 Redis 功能的解决方案成为一项挑战。

GitHub 开源项目 nalgeon/redka,该项目在 GitHub 有超过 2.0k...

阅读更多

全语言无差别应用性能分析器

在生产级数据中心进行应用性能分析时,实现低开销、高效准确的程序性能分析是个极具挑战的问题。特别是在复杂的服务环境下,需要跨语言、跨系统进行全面的性能剖析,以便于快速准确地定位性能瓶颈。常规的性能分析工具要么侵入性太强、要么难以提供足够深度的信息、要么运行成本过高。在不打扰现有服务运行的前提下,进行细粒度性能分析一直是工程师们面临的一个核心痛点。

GitHub 开源项目 elastic/otel-profiling-agent,该项目在 GitHub 有超过 1.3k Star,一句话介绍该项目:The production-scale datacenter...

阅读更多

开源 RAG 引擎,大模型应用开发必备框架

在当今信息爆炸的社会,大量的数据充斥着我们的生活。每天都有海量的资料以各种格式生成,如 Word、slides、excel、txt、图片、扫描件、结构化数据、网页等。这些文档在大多数情况下具有复杂并且不规则的格式,使得从中提取关键信息变得极其困难。这种情况下,一个能深入理解文档并提供真实问答能力的系统就显得非常必要。

GitHub 开源项目 infiniflow/ragflow,该项目在 GitHub 有超过 1.2k Star,一句话介绍该项目:RAGFlow is...

阅读更多

定制化生成代码和终端的代码图片

在编程,教学或技术推广的过程中,我们经常会碰到需要展示代码或终端输出结果的情况。传统的做法是截屏或复制粘贴文本,但这样的效果往往并不理想,不仅因为所示的代码样式单一、不够美观,且根据不同的展示环境,效果展示不一,更重要的是这种方式无法定制优化,例如我们想更改代码的主题样式、字体大小,或者模拟终端的样式等等,这就使得我们的展示并不能达到最佳效果。

GitHub 开源项目 charmbracelet/freeze,该项目在 GitHub 有超过 1.3k Star,一句话介绍该项目:Generate images of...

阅读更多

Devin 的开源竞争对手,智能 AI 软件工程师

在今天的软件开发过程中,编写代码是偏繁重同时也是低效的工作。工程师需要花费大量的时间在搜寻资料、设计算法、测试和反复修改代码上。同时,编写的代码还可能存在 bug,需要编程人员不断地去调试和修复。这些问题无疑是当前软件工程师们面临的核心痛点。

GitHub 开源项目 stitionai/devika,该项目在 GitHub 有超过 1.0k Star,一句话介绍该项目:Devika is...

阅读更多

前沿探索,适用于 AI 设备的开源生态系统

我们身边的人工智能设备越来越多,如何围绕这种普遍存在的设备构建一个开源生态系统变得尤为重要。尤其是在维护设备功能、隐私保护以及实现设备之间的相互协作等方面,便需要一款能够为我们解决这些问题的开源产品。

GitHub 开源项目 OpenInterpreter/01,该项目在 GitHub 有超过 1.2k Star,一句话介绍该项目:The open-source language...

阅读更多

可定制的音频控制面板,让你的电脑使用体验更酷

在我们的日常电脑工作和娱乐时间里,经常可能会同时运行着音乐播放器、游戏和语音聊天等多个应用程序。这就可能会导致一个问题:正在玩游戏或者进行其他工作时,你可能听到音乐或者聊天音量太大或太小。然而,调整每个应用程序的音量通常需要切换到该应用程序,这可能会打断我们正在做的事情,使体验变得不那么顺畅。

GitHub 开源项目 omriharel/deej,该项目在 GitHub 有超过 4.1k Star,一句话介绍该项目:Set app volumes...

阅读更多

微软主导,一款面向 Kubernetes 的分布式网络可观测工具

于云原生架构中,Kubernetes 已经成为了业界标准。然而,虽然 Kubernetes 提供了丰富的特性,但是网络监控和安全仍然是许多开发者和系统管理员头疼的问题。在微服务架构日益复杂,服务之间网络调用频繁的情况下,对网络的监控和洞察越来越重要,这不仅可以帮助我们排查网络问题,定位故障点,也可以帮助我们发现潜在的安全问题。

GitHub 开源项目 microsoft/retina,该项目在 GitHub 有差不多 1000...

阅读更多

重新定义网络浏览体验,通过自然语言无缝进行浏览器交互

在日常生活和工作中,我们经常需要在网络上进行各种操作,比如支付账单、填写表单或从特定网站提取数据。这些任务往往是重复性的,费时且不需要过多认知努力。但是,手动执行这些任务却需要消耗我们大量的时间和注意力。

GitHub 开源项目 lavague-ai/LaVague,该项目在 GitHub 有超过 1.9k Star,一句话介绍该项目:Automate automation with...

阅读更多

高性能离线 IP 地址查询系统

项目背景

在电子商务、广告投放、大数据分析等领域,通过用户的 IP 地址来获取和分析其地理位置信息,是一种常见操作。然而这样就存在一个问题,我们需要一个具有高效 IP 地址查询功能的工具,可以快速查找出 IP 地址对应的具体地点,否则用户可能花费大量时间在处理和分析这些 IP 数据上。

GitHub...

阅读更多

大模型加持的浏览器自动化工具,抢茅台也是可以的

项目背景

在当今的信息化社会,我们经常需要通过浏览器进去各种网页操作,同时我们也会遇到网页上的一些操作流程繁琐、耗时久的问题。而传统的浏览器自动化工具需要针对每个网站编写定制的脚本,这种方法依赖于网页的 DOM 解析和 XPath 交互,一旦网站布局发生变化,原先的自动化流程就可能出现问题。因此,我们需要一种能适应网站变化,同时能解决这些问题的工具。

GitHub 开源项目 Skyvern-AI/skyvern,该项目在 GitHub 有超过...

阅读更多

开发者必备神器,一款开发环境管理器

在编程生涯中,几乎每一个开发者都会遇到这个痛点:如何方便、快速地搭建和配置开发环境。想象一个场景,在新的工作环境或者新的项目开始时,你可能需要花费大量的时间用来安装依赖包、配置环境变量、解决版本冲突问题等等,巨大的精力消耗在这些繁琐的工作上,而不是专注于开发工作本身。这个问题在远程工作中更为突出,你可能要应对网络问题、权限问题等更多未知的问题。因此,一个方便、快速的开发环境管理器就显得尤为重要。

GitHub 开源项目 daytonaio/daytona,该项目在 GitHub 有超过 4.2k Star,一句话介绍该项目:The Open Source...

阅读更多

可以本地运行的命令行 AI 工具

在我们进行编程的过程中,可能会遇到各种问题,比如对于某些命令行的使用不熟悉,或是在编码过程中需要生成某种复杂的一行代码,这些过程都需要我们花费大量的时间与精力。而随着大模型的出现,我们希望通过智能化的方式,解决这些问题,提升我们的编程效率。

GitHub 开源项目 yusufcanb/tlm,该项目在 GitHub 有差不多 1000 Star,一句话介绍该项目:Local CLI Copilot,...

阅读更多

微软开源生成式 AI 课程

在日常的开发工作中,我们可能会遇到用算法创建出新的、原始的内容的需求,这是普通的 AI 和机器学习可能难以胜任的。但生成AI(Generative AI)的出现,为此类问题提供了解决方案。生成 AI 是 AI 的一个重要分支,能够让计算机产生新的、原始的含有类似人类创造力的内容,如生成音乐、写文章、设计艺术品甚至编写程序的能力。但如何入门成为生成 AI 的开发者呢?可能涉及到的问题有:缺少系统性的入门资料,难以理解和应用复杂的生成模型等等。

今天要给大家推荐一个...

阅读更多

一款任天堂 Switch 模拟器

随着移动游戏产业的快速发展,任天堂 Switch 的热度不断攀升。但是,由于硬件的局限性,我们无法在 PC 端上直接享受Switch 游戏,这就给我们的游戏体验带来了麻烦。此外,由于 Switch 游戏平台采用的硬件环境和其他游戏平台的硬件环境差异较大,使得针对 Switch 游戏的开发和适配需要投入大量精力。

今天要给大家推荐一个...

阅读更多

使用 Docker 运行 Windows 容器,太方便了

在我们的开发过程中,我们可能需要为应用程序在不同的 Windows 系统环境中进行测试,又或者我们可能需要在 Linux 系统上运行一些 Windows 应用。这时,我们常常需要通过虚拟机来实现这个需求,但是这种方法往往设置复杂,占用大量的硬件资源。

GitHub 开源项目 dockur/windows,该项目在...

阅读更多

快速开发 UI 页面的工具包

在前端编程中,我们如何更快地构建更好的用户界面一直是一个重要而复杂的问题。使用 JavaScript(如 React)开发前端应用是常见的选择,然而这需要我们深入学习和理解新的编程语言和工具。此外,前后端开发通常需要复制和粘贴组件到每个视图中,这与开发效率和代码可维护性相悖。

GitHub 开源项目 pydantic/FastUI,该项目在 GitHub 有超过 6.3k Star,一句话介绍该项目:Build...

阅读更多

支持超过 50+ 网站的跨平台全能资源下载工具

在当今的数字时代,互联网上充满了大量有价值的图片、音视频、文本等各类资源。然而,我们常常会遇到抓取这些资源的困难,需要在不同的网站上使用各种复杂的抓取工具,且不同工具界面操作各异、方位相当零碎。希望能有一个全能一体的、安装简便的、支持多线程、且用户界面友好化的应用,方便对资源进行下载。

GitHub 开源项目 KurtBestor/Hitomi-Downloader,该项目在 GitHub 有超过 19.0k Star,一句话介绍该项目:Desktop utility to...

阅读更多

无需前端技能即可快速创建机器学习 Web 应用

在机器学习开发过程中,我们经常会需要将模型、API 或任何 Arbitrary Python 函数以应用的形式展示给他人,但是编写 Web 应用并显示我们的模型结果通常需要 JavaScript、CSS 和 Web 服务托管等复杂技能。有没有一种方式可以快速、无需编程和服务托管就可以将我们的...

阅读更多

少量样本即可训练出色的文本转语音模型

当今时代,文本转语音技术(TTS, Text to Speech)在人工智能领域逐渐占领一席之地。但是,要想训练一个出色的语音模型,往往需要大量的语音数据,而且这些数据的获取成本极高。一方面,你需要筛选和标注大量的音频数据,另一方面,你也需要一个强大的计算能力来处理这些数据。那么,能否有一种方法,只需要少量的语音数据,就能训练出一个高质量的语音模型呢?

GitHub 开源项目 RVC-Boss/GPT-SoVITS,该项目在 GitHub 有超过 17.8k...

阅读更多

可以在任何地方运行的超小视觉语言模型

随着深度学习的发展,模型越来越大,而且需要大量的计算资源,这使得很多人难以使用。同时,尽管难度较大,但视觉和语言的结合对于许多实际应用来说却十分有用,例如对图像进行描述,回答关于图像的问题等。但这样的模型往往计算量大,运行速度慢,不易在移动设备上使用。

GitHub 开源项目 vikhyat/moondream,该项目在 GitHub 有超过 2.8k Star,一句话介绍该项目:tiny vision language...

阅读更多

无锁高性能缓存库推荐

在高并发的分布式系统中,如何提高性能、提高响应速度是我们长期面临且头疼的问题。许多开发者和团队采取缓存策略来改善这种状况,那到底什么样的缓存机制才能真正地帮助我们实现这个目标呢?Go 语言中的缓存库大多是基于 map 和互斥锁实现的,这种方式在并发高的场景下容易产生大量的争抢锁情况,而其在 eviction policy 的实现也往往难以与其他语言中优秀的缓存库如 Java 的 Caffeine 相比拼。另外,像...

阅读更多

跨平台支持软件快速安装并切换管理的工具

在当下繁忙的项目开发中,我们会在不同的开发项目间切换,这些项目可能需要不同的运行环境或者库。同时,这些环境的配置可能极其复杂,我们需要分别进行配置。这一系列的问题使我们的开发过程变得枯燥无趣,且极度消耗时间和精力。

GitHub 开源项目 version-fox/vfox,该项目在 GitHub 有超过 1.7k Star,一句话介绍该项目:A cross-platform and...

阅读更多

快速将数据和 AI 算法转化为生产就绪的 Web 应用程序

在当前数据化、算法化的环境中,有很多场景会碰到需要将数据和 AI 算法转化为生产就绪的网络应用程序的情况。这需要你既要有较强的数据和算法能力,同时还要有全栈开发的技巧。然而对于大部分数据科学家和机器学习工程师来说,他们的专长并不在后端开发和前端设计上,这使得他们无法有效地推广他们的算法。为了能更好地让数据和 AI 算法应用于实际,这就需要一个可以简化开发和部署过程的工具。

GitHub 开源项目 Avaiga/taipy,该项目在 GitHub 有超过...

阅读更多

适用于 Kubernetes 的多集群管理系统

作为一名使用 Kubernetes 的工程师,我们经常会遇到跨多个 Kubernetes 集群进行资源管理的问题。这是一个常见而又困扰许多工程师的问题。传统的 Kubernetes Federation v2 让我们可以通过联合类资源 FederatedDeployment、FederatedReplicaSet、FederatedSecret 等来管理多集群的...

阅读更多

异地恋神器,一个在线同步播放影片的项目

在当今的互联网如此发达的今天,我们很多的工作和学习都可以远程进行,一些商业和休闲活动也开始转移到在线。看电影或者直播成为了大家联系互动、消磨时间的重要方式。但是,因为地理位置或网络问题,有时我们和我们想要一起看电影或直播的人无法进行同步观看,这就是需要解决的问题。

GitHub 开源项目 synctv-org/synctv,该项目在 GitHub 有差不多 1000 Star,一句话介绍该项目:Synchronized viewing, theater,...

阅读更多

解决 K8S 使用大难题的包管理工具

在 Kubernetes 的生态环境中,传统的包管理或直接应用 manifest 可能会非常复杂,并不能很好地进行扩展。这种复杂性可能导致安装和升级 Kubernetes 包变得困难,并且难以管理包的依赖关系。此外,对于希望将 GitOps 方法引入其集群的用户,找到能够支持 GitOps 的...

阅读更多

使用 Go 开发但通过 JS 编写规则的爬虫工具

在现代的网络环境中,你时常会需要抓取网络页面上的各类数据。 或许你是一个业务分析师,需要收集大量的开放数据进行数据建模,或许你是内容研究员,需要收集新闻资讯进行文本分析。不论你身处何种情景,你都可能会面临如何高效、准确地从网页上抓取到你需要的信息,特别是在复杂且动态更新的网页环境中,完成这项工作将显得尤其困难。

GitHub 开源项目 philippta/flyscrape,该项目在 GitHub 有差不多 1000 Star,一句话介绍该项目:A standalone...

阅读更多

开箱即用的 Protocol Buffer 数据验证工具

现代软件开发环境中,保证数据的完整性和一致性是一个重要的问题,尤其是跨网络甚至不同语言环境下的通信。谷歌的 Protocol Buffer 提供了一种跨平台、跨语言的通信协议,然而在默认情况下,它不会对数据进行任何形式的验证,这就要求开发人员在客户端和服务器端都进行相应的数据验证工作,这无疑增加了开发的复杂度。

GitHub 开源项目 bufbuild/protovalidate,该项目在 GitHub 有差不多 1000...

阅读更多

兼顾本地数据安全的数据交互协议

随着数据和应用在云上的普及,我们越来越依赖中心化的客户端服务器架构来管理信息。然而,这种架构会使我们受限于服务商的规定,并最终可能威胁我们的数据所有权和数字体验。另一方面,为了避免这种情况,我们可能会选择离线优先的单用户使用工具,但这意味着功能的妥协。这种矛盾是我们在信息管理方面经常遇到的问题。

GitHub 开源项目 anyproto/any-sync,该项目在 GitHub 有差不多 1000 Star,一句话介绍该项目:An open-source protocol...

阅读更多

在博客文章嵌入交互式代码片段的平台

我们在编写文档、开发在线课程或者撰写技术博客时,经常需要插入一些代码片段来解释具体概念或者演示算法运行效果。然而,普通的书写工具并不能很好的支持代码片段的排版和交互操作,用户无法直接在文中运行和修改代码。这种沟通方式的单向性和僵化性,显著降低了文档的可读性和用户的学习效率。

GitHub 开源项目 nalgeon/codapi,该项目在 GitHub 有差不多 1000 Star,一句话介绍该项目:Interactive code examples...

阅读更多

无侵入式治理微服务的系统

在微服务架构中,服务间的连接、安全、控制和监控是任何系统开发者和维护者都需要面临的问题。随着服务的增多和系统的复杂性增长,这些问题益发复杂和繁琐,如何有效地解决这些问题,成为了困扰开发者的拦路虎。

GitHub 开源项目 istio/istio,该项目在 GitHub 有超过 34.4k Star,一句话介绍该项目:Connect, secure, control,...

阅读更多

轻量级、低开销且功能强大的虚拟 K8S 集群解决方案

在大数据和云计算的背景下,Kubernetes(K8s)已经成为了集群管理的业界标准。然而,在大型多租户的环境中,如何合理、高效地管理这些集群却成为了一个问题。不同的集群可能需要运行不同版本的 Kubernetes,同时为了避免集群间的相互影响,我们往往要为每一个项目或者用户创建一个新的集群,这导致了资源的巨大浪费。另一方面,如果只用命名空间隔离租户,可能无法提供足够的多租户隔离和集群级别的资源。

GitHub 开源项目 loft-sh/vcluster,该项目在 GitHub 有超过 4.5k Star,一句话介绍该项目:vCluster -...

阅读更多

基于自然语言描述的命令行运维工具

为我们的日常工作带来便利是开源项目的重要意义之一。每个人都会遇到需要繁琐手动操作的问题,比如统计 Home 目录中Git 仓库的数量和磁盘占用,查看某个文件夹中所有 CSV 文件的 pd.describe() 结果,查询当前活动的端口以及属于 Google 的端口,并关闭它们等等。这些看似琐碎的任务如果都需要手动去写命令需要耗费不少时间。

今天要给大家推荐一个...

阅读更多

可在手机端部署的大模型

在自然语言处理领域,语言模型是一个重要的维度,它是理解和生成人类自然语言的关键工具。然而,目前的大部分语言模型都存在着计算量大、存储空间需求高和部署困难等问题。这在一定程度上限制了语言模型的应用范围和效果,特别是对于端侧设备,这些问题更加突出。

GitHub 开源项目 OpenBMB/MiniCPM,该项目在 GitHub 有超过 2.4k Star,用一句话介绍该项目就是:MiniCPM-2B: An end-side...

阅读更多

支持日志添加色彩的轻量级工具库

在日常的开发过程中,控制台日志是我们调试问题、了解系统运行状态的重要手段之一,然而众所周知,传统的控制台日志都是单调的黑白文本,分析和查看起来费时费力,同时也缺乏美观性。对于编程者来说,如果有丰富多彩的日志输出,不仅可以提升查看体验,也更有利于我们快速定位和理解关键信息。

GitHub 开源项目 lmittmann/tint,该项目在 GitHub 有差不多 1000 Star,一句话介绍该项目: slog.Handler that...

阅读更多

支持细粒度访问控制的 AI API 管理网关

我们通常会遇到调用 AI 网关的问题,例如你需要调用 OpenAI,Azure OpenAI 或者 Anthropic 进行特定的开发工作,但是这些 AI 服务提供商并没有提供细粒度的访问控制,这里的访问控制包括:访问的频率限制、花费限制以及会话的存在时间限制等。如果不加以控制,这可能会导致服务调用成本无法控制,甚至有数据安全风险。

今天要给大家推荐一个...

阅读更多

软件敏感信息管理的开源解决方案

随着软件系统复杂度不断提升,需对各种敏感信息的安全问题加以关注。例如数据库证书、第三方服务的 API 密钥或者服务间通信的认证信息。要清楚掌握谁在何时何地访问了何种敏感信息就已经很困难,而如果再加上密钥环转、安全存储、详细审计日志的需求,就几乎无法不借助定制解决方案来解决这些问题。

GitHub 开源项目 openbao/openbao,该项目在 GitHub 有超过 1.3k Star,一句话介绍该项目:OpenBao...

阅读更多

保持代码整洁和解耦的效率工具

能够清晰可视化地理解和管理代码库的依赖关系,以保持代码的整洁和解耦是大型项目开发中的一项挑战。往往项目的规模庞大,代码遍布各个案,复杂的依赖关系容易造成代码的混乱和硬耦合,这也是众多开发者会遇到的问题。

GitHub 开源项目 gabotechs/dep-tree,该项目在 GitHub 有差不多 1000 Star,一句话介绍该项目:tool for helping...

阅读更多

高效处理小文件的分布式存储系统

在大规模数据存储和处理的背景下,我们常常会遇到如何有效、高效地存储和访问亿级别的小文件的问题。一方面,传统的单机存储无法胜任大规模文件的存储;另一方面,常见的分布式文件系统,如 HDFS、Ceph 等,在处理小文件存储时,往往因为元数据管理压力大、数据访问效率低等问题,难以满足需求。为此,需要一种能够解决这些问题的分布式存储系统。

GitHub 开源项目 seaweedfs/seaweedfs,该项目在 GitHub 有超过 20.1k Star,用一句话介绍该项目就是:SeaweedFS...

阅读更多

太神奇了,用 Excel 模拟 CPU 的工作原理

虽然 Excel 主要被用作电子表格工具,但它也可以执行一些计算机科学方面的工作。比如,你有没有想过在 Excel 里编写和执行程序?相信你早已熟知 Python、Java、C++ 等编程语言,但你可能从未听说过 Excel-ASM16,这是一种能在 Excel 中运行的编程语言。你有没有想过,在 Excel...

阅读更多

使用 AI 不是能力问题,而是一个集成问题

在 2023 年以来,人们已经看到了大量的 AI 应用程序用于完成各种任务。然而要将这些 AI 应用系统地整合到我们的生活中并不容易。AI 面临的最大问题并不是功能问题,而是集成问题。诸如:管理各种 AI 提示,发现新的 AI...

阅读更多

黑客必备工具之子域名枚举

在网络安全领域,子域名枚举是一种常见的信息收集技术,越来越多的黑客和渗透测试人员用其寻找潜在的安全漏洞。然而,传统的子域名枚举工具存在两个核心问题:一是生成的子域名列表泛滥,并不能有效增加找到真实子域名的可能性;二是处理速度慢且无法定制,往往不能满足实战需求。

GitHub 开源项目 projectdiscovery/alterx,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:Fast and customizable...

阅读更多

方便访问安全漏洞数据库的工具

在信息安全的领域,常见的一个难题就是如何有效、便利的获取及管理广大的漏洞库?为了应对大量的 CVE(公共漏洞和披露),通常会花费大量的时间和精力去遍历多个漏洞数据库,如国家漏洞数据库 (NVD),已知的被利用的漏洞目录 (KEV),黑客攻击预测评分系统 (EPSS),以及各种出现在 GitHub 上面的漏洞验证模板和已公开的漏洞代码的库。每当新的漏洞出现,即使是有经验的开发者也需要花费大量的时间去收集和阅读相关信息。这样一来,无论我们是要针对应用程序和系统进行安全分析,还是只是想跟踪和管理已知漏洞,都会感到力不从心。

GitHub 开源项目 projectdiscovery/cvemap,该项目在...

阅读更多

本地运行和管理大模型的工具

项目背景

在当前具有高速发展的人工智能和机器学习领域,语言模型正朝着更大、更复杂的方向发展。然而,随着模型规模的不断扩大,这样的模型往往需要大量的计算资源来运行,并且需要专业化的技术知识来进行管理和维护。这使得很多开发者或研究者面临困扰,如何在本地运行和管理这些大型语言模型呢?

GitHub 开源项目 ollama/ollama,该项目在 GitHub 有超过 34.7k Star,用一句话介绍该项目就是:Get up and...

阅读更多

一周构建一个 LSM 树存储引擎

对于计算机专业学习者或是具有相关项目需求的开发者来说,想要自己动手构建一个存储引擎并不易实现。尤其是 LSM 树(Log-structured Merge-tree)存储引擎,为了适配大数据和高写入量场景,设计和实现上都需要投入较大的精力来完成。此时,如果有一个详细的项目教程引导你走过这个复杂的过程,那是不是也太好了。

GitHub 开源项目 skyzh/mini-lsm,该项目在 GitHub 有超过 1.9k...

阅读更多

支持 90+ 语言的文档 OCR 工具包

随着科技的发展和全球化的进程,我们经常遇到需要处理多语种文档的情况,例如商业合同、学术论文等。然而,当前主流的 OCR(Optical Character Recognition 光学字符识别)工具或许可以精准地识别英文文本,但对其他语种的文本识别能力却略显薄弱。此外,真实世界的文档常常包含表格、图表等复杂布局,充斥着线性、非线性排列的文本,这也增加了文本识别的难度。因此,我们急需一个精确度高、支持多语种、能智能识别文本和表格的 OCR 工具。

GitHub 开源项目 VikParuchuri/surya,该项目在...

阅读更多

微软开源的数据分析任务处理系统

在数据分析领域,我们经常会遇到需要将多种数据分析任务无缝地计划和执行的挑战。这些任务可能涉及诸如查看和解析数据、运行算法、生成报告等复杂过程。由于这些任务经常需要从多个源获取和处理数据,如数据库、网页以及 API,因此我们需要一个既可高效协调任务,又可方便地整合各类功能的解决方案。此外,为了提高代码质量,我们也需要一个可以检查输出代码并提供修复建议的工具。

GitHub 开源项目 microsoft/TaskWeaver,该项目在 GitHub 有超过 3.2k Star,用一句话介绍该项目就是:A code-first...

阅读更多

网易有道开源的本地化知识库问答系统,支持 PDF、Word 等自由检索

在日常生活和工作中,我们时常面临大量本地信息资料(PDF、Doc 等)需要关联理解和处理。频繁地切换区分文件格式,加上需要跨语言理解的环境下,如何找到一个准确、快速、可靠地处理文件的解决方案恍若眼前一道难题。这个问题非常现实,也非常复杂,我们需要一个强大且可靠的工具来解决这个问题。

GitHub 开源项目 netease-youdao/QAnything,该项目在 GitHub 有超过 1.7k Star,一句话介绍该项目:Question and...

阅读更多

基于 Go/eBPF 的开源云原生负载均衡器

在构建和运行云原生应用的过程中,我们会面临这样的一个挑战,需要跨不同环境(包括本地、公有云或混合的 K8s 环境)实现负载均衡的需求。标准的解决方案可能无法满足性能、灵活性、可定制性和所有 Kubernetes 发行版本/CNI 的兼容性等各方面的需求。

GitHub...

阅读更多

有效追踪和检测 Go 代码中的潜在 panic

测试工作中,你是否遇到过在生产中突然出现 nil 空值 panic(程序崩溃)的问题?这些问题出现的时间点往往是在编译之后而非之前,给我们的开发工作带来了极大的不便。如果我们能在编译时期就发现这些潜在的问题,那将更为理想。

GitHub 开源项目 uber-go/nilaway,该项目在 GitHub 有超过 2.3k...

阅读更多

Go 实现的 llama 模型调试与推理库

大家都喜欢大而复杂的模型,如 GPT,但是这些模型大多需要 GPU 集群来完成运算,花费不菲。而且,在编程语言方面,我们经常需要在高性能和易用性之间作出取舍,例如 C++ 具有高性能,但其底层性质使其难以推广。如果你也在烦恼这样的问题,那么 Llama.go 项目或许会是你的选择。

GitHub 开源项目...

阅读更多

运行速度快可靠的后台任务执行系统

在计算机编程和服务器管理领域中,我们经常面临需要处理大量后台运行任务的问题。当我们的应用程序需要执行一些耗时较长、可能失败的操作时,如电子邮件通知、数据同步、日志更新等,我们通常会把这些任务放在后台运行,以便它们不会阻塞主线程,影响用户的体验。然而,编写这样的后台任务并非易事,我们需要确保它们能够快速而可靠地运行,而且必须能够处理各种可能的故障。这就需要我们有一个强大、可靠且高效的后台任务运行环境,那应该如何更好的解决?

GitHub 开源项目 riverqueue/river,该项目在 GitHub 有超过 1.6k Star,用一句话介绍该项目就是:Fast and reliable...

阅读更多

更快更安全的全新 SSH3 协议

在当今,信息安全对于企业、个人或系统来说都至关重要的背景下,我们需要像 SSH 这样用于加密远程登录的安全协议。然而,SSH2 协议虽然在功能上已经相当完善,但是在满足现代网络环境的安全和性能需求上仍存在一些瓶颈。

GitHub 开源项目 francoismichel/ssh3,该项目在 GitHub 有超过 2.3k...

阅读更多

系统级别的广告屏蔽应用,不只是浏览器

近年来,随着网络技术的广泛应用,网络广告已成为我们日常生活中无法忽视的一部分,然而过滤网络广告却是我们常常头疼的问题。同时,网络隐私泄露问题也令我们烦恼不已。除了浏览器内的广告和跟踪,还有一些桌面应用和操作系统组件等都可能存在广告和隐私跟踪问题,虽然市面已经有一些浏览器插件能够解决部分问题,但是这些问题有的不在浏览器上操作,对应的插件也无法起作用。因此,我们需要一款更全面、更有效的广告屏蔽和隐私保护工具。

GitHub 开源项目 anfragment/zen,该项目在 GitHub 有超过 1.6k Star,用一句话介绍该项目就是:“Simple, free and...

阅读更多

网易云/QQ音乐歌单跨平台迁移

在数字音乐平台林立的今天,我们会面临一个十分痛苦的尴尬现象——向其他音乐平台迁移自己的歌单。考虑到每个平台都有自己的独家资源、特色推荐以及用户体验,这都使得我们不可避免的会使用多个平台。这就导致我们的喜爱歌曲、精心策划的音乐都散落在各个平台,给我们带来极大的不便。

GitHub 开源项目 Bistutu/GoMusic,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“迁移网易云/QQ音乐歌单至 Apple/Youtube/Spotify Music”。

...

阅读更多

云原生毕业项目,事件驱动的资源扩缩容组件

在实时计算或事件驱动的微服务中,我们常常会遇到一个问题,即如何根据实时任务的数量,动态的分配相关的计算和存储资源。这是一个比较难以解决的问题,因为我们需要实时监控系统的负载并根据实时负载来调整计算资源,这需要有复杂的负载均衡器和资源管理器,对于 Kubernetes(简称 k8s)用户来说,难以实现精细化的、基于事件驱动的自动化扩容。

GitHub 开源项目 kedacore/keda,该项目在 GitHub 有超过 7.4k Star,用一句话介绍该项目就是:“...

阅读更多

一个云原生秘钥管理系统

在开发、测试、构建应用过程中,我们经常会遇到一个问题,如何安全、方便地使用各种秘钥?现如今许多秘钥和敏感信息比如 token,AWS 密钥等都需要被保存在我们的开发环境中。往往我们为了方便,将这些信息导出环境变量或者硬编码在本地的 .env 文件,都可能会导致这敏感信息的泄露。多云秘钥管理更增加了复杂性,我们希望有一套工具,可以集中、安全地对各种密钥进行管理。

GitHub 开源项目 tellerops/teller,该项目在 GitHub 有超过...

阅读更多

教你从零开始学习 Jenkins 的开源项目

在现代化的软件开发过程中,我们常常需要通过持续集成(CI)和持续部署(CD)流程,来确保我们的应用程序可以快速且自动化地从开发阶段转变到运行阶段。这其中,如何迅速有效地部署 Jenkins,是一个常见的挑战。同时,如何配置 Docker 作为从节点(Slave),如何在 GitOps 方式中使用 Argo CD 将应用程序部署到 k8s,都是我们日常工作中需要处理的问题。

今天要给大家推荐一个...

阅读更多

专为企业级大模型开发的框架、工具和模型

在当今的企业环境下,很多的公司都在落地大模型相关的应用。但是并不是每个公司都具备相应的专业大模型的人才,能够很好的处理大模型落地过程中碰到的问题。

GitHub 开源项目 llmware-ai/llmware,该项目在 GitHub 有超过 1.6k Star,用一句话介绍该项目就是:“Providing enterprise-grade LLM-based...

阅读更多

无纸化办公工具,支持文档扫描、索引和归档

在日常生活、学习和工作中,我们难免要面对大量的纸质文件和资料,这些文件可能包含了重要的信息,需要妥善保管。然而,纸质文件易遗失、易损坏,且查询和管理都需要极大的精力和时间,这无疑是一项颇有挑战的任务。

GitHub 开源项目 paperless-ngx/paperless-ngx,该项目在 GitHub 有超过 14.5k Star,用一句话介绍该项目就是:“A community-supported supercharged...

阅读更多

将微信读书划线同步到 Notion

在信息时代,获取知识的途径不再局限于实体书籍,而是延伸到了各式各样的电子阅读平台,微信读书就是其中的一个重要代表。但是,对于广大喜欢在阅读过程中做笔记、划重点的读者来说,往往会遇到一个尴尬的局面——即便在微信读书上划过重点,标注过笔记,也无法有效地进行整理和管理,更不用说与自己其他的笔记工具,比如 Notion 进行同步。这就导致了我们对知识的美好消费遇到了阻碍,既不能实时复习,也无法做到灵活地跨平台调用。

GitHub 开源项目 malinkang/weread_to_notion,该项目在 GitHub 有超过 1.5k Star,用一句话介绍该项目就是:“将微信读书划线同步到Notion”。

...

阅读更多

只需少量计算和内存资源即可运行的小型 Llama 大模型

在当今这个数据爆炸的时代,语言模型的训练变得越来越复杂和困难。我们需要巨大的计算资源和时间来训练一个高效的语言模型。然而,这对许多人来说并不现实。与此同时,我们也遇到了如何在有限的内存和计算资源中使用大型语言模型的挑战,特别是在边缘设备上。

GitHub 开源项目 jzhang38/TinyLlama,该项目在 GitHub 有超过 4.3k Star,用一句话介绍该项目就是:“The TinyLlama project...

阅读更多

一款更好的与私有数据交互的大模型框架

项目背景

检索增强生成(RAG) 是一种使用来自私有或专有数据源的信息来辅助文本生成的技术。 它将检索模型(设计用于搜索大型数据集或知识库)和生成模型(例如大型语言模型 LLM)结合在一起。然而,对于大多数开发者来说,创建和部署 AI 应用时依然面临着许多问题,如数据管理困难,数据嵌入的生成与存储问题,以及建立互动对话在用户体验上的挑战。这些问题都阻碍了 AI 应用的快速开发和部署,其实本质上也就是以上 RAG 的流程不是很容易搞定。

今天要给大家推荐一个...

阅读更多

面向 DevOps 工程师的 AWS 30 天教学课程

在当前的云计算时代,亚马逊的 AWS 已经成为了行业里的领先者之一。无论是在企业还是个人的应用中, AWS 都得到了广泛的使用。但是,对于 DevOps 工程师来说,有效地学习和掌握 AWS 是一项具有挑战性的任务,它需要对众多的 AWS 服务和工具有深入的理解和实战经验。而实践,更是提升...

阅读更多

NeurIPS 官方推荐的开源大模型启动套件

在处于大数据和高性能计算领域的今天,大型语言模型(LLMs)正逐渐成为人工智能领域最有成效的工具之一。然而,尽管 LLMs 在一系列任务中表现出来的微妙性和宽广的知识使其非常强大,但是它们的部署和实施却很复杂。接触到的问题可能包括:需要处理大量的数据,需要大量的计算能力,对内存和存储需求较高,模型微调和部署的复杂性等。同时,我们也需要一个一站式的解决方案,可以方便地查找和实现不同的模型,这样可以节省我们的时间并提高工作效率。

GitHub 开源项目 Lightning-AI/lit-gpt,该项目在 GitHub 有超过 4.5k Star,用一句话介绍该项目就是:“Hackable...

阅读更多

频繁用到的计算机视觉工具集合

在视觉相关工程师的日常工作中,需要大量时间书写计算机视觉工具,但这类工具往往存在重复的问题。为了解决这个问题,我们往往会对现有的代码进行修改或重用,但这可能会带来新的问题,例如缺乏高度的定制化、代码结构混乱导致后期难以维护、或者无法适应新的数据集。这些问题都让我们非常苦恼。

GitHub 开源项目 roboflow/supervision,该项目在 GitHub 有超过 8.1k Star,用一句话介绍该项目就是:“We write your...

阅读更多

用于融合预训练语言模型的工具包

项目背景

在自然语言处理领域,语言模型预训练是一个常见的任务。然而,如何有效的融合多个预训练语言模型,仍然是一个开放性的问题。传统方法通常只能简单地通过线性方式混合不同模型的输出,这种方式考虑的信息较为有限,不能很好地对模型中的深层信息进行整合。此外,由于语言模型中包含多个层,而各层之间的相互作用、依赖关系也是模型能否取得好效果的关键。因此,如何在融合模型时,将这些层级信息进行有效整合,是现阶段亟待解决的问题。

GitHub 开源项目 cg123/mergekit,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“Tools for merging...

阅读更多

基于 Python 的 LLM 推断和服务框架

今天我要介绍的是一个轻量级、易扩展、高性能的大语言模型 (LLM) 推断和服务框架:LightLLM。在大数据和 AI 领域,我们常常会遇到本地资源无法承载大语言模型推断,或者语言模型服务效率低下的问题,那么 LightLLM 就是为了解决这类问题而生的。

LightLLM 在...

阅读更多

微软开源的统一大模型评估框架

在自然语言处理 (NLP) 领域,大型语言模型(如 GPT-4、BERT 等)已经被广泛的应用。然而,如何快速、有效的评估这些大型语言模型的性能并不是一个容易的问题。存在以下几个挑战:第一,公开的评估方法过于分散,导致研究者在不同的库、框架中反复切换;第二,缺少全面并且可扩展的工具库去实现从构建模型、加载数据集到评估模型性能的一站式服务;第三,缺乏对模型生成样本复杂性的动态控制。

GitHub 开源项目 microsoft/promptbench,该项目在 GitHub 有超过...

阅读更多

学生党打工人的福音,对任意主题自动化生成调研报告

在现今信息爆炸的社会中,寻找、筛选和了解关于某一话题的全面细致信息变得日益困难。手动研究任务需要花费大量时间找到合适的资源和信息,有时可能要持续数周。此外,目前的 LLMs(大语言模型)训练的都是过时信息,存在严重的产生错误记忆的风险,这使得它们在研究任务中用处比较有限。像 ChatGPT + Web 插件这样具有网络搜索功能的解决方案,仅考虑了有限的资源和内容,有可能结果表面化,甚至带有偏见。

GitHub 开源项目 assafelovic/gpt-researcher,该项目在 GitHub...

阅读更多

手把手教你打造一个金融大模型咨询系统

在实时金融咨询领域,我们经常面临如何高效准确地分析和回应用户问题这样的复杂任务,同时,如何将最新的金融新闻与用户的咨询内容结合起来,以产生更深入、更贴近当前金融形势的答复,也是一项挑战。随着现在大语言模型的出现,是一个很好解决以上问题的方法,但是许多开发者可能在如何配置和部署相关大模型系统上会遇到困难,这可能导致开发的效率和效果下降。

GitHub 开源项目 iusztinpaul/hands-on-llms,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“𝗟𝗲𝗮𝗿𝗻 about 𝗟𝗟𝗠𝘀,...

阅读更多

针对中文特殊优化的大语言模型

在自然语言处理(NLP)的研究和应用中,如何有效地利用大型语言模型进行中文文本处理是一个关键的挑战。这方面的问题主要包括中文词表的扩展,大模型的训练和部署,中文语义理解能力的提升等。

GitHub 开源项目 ymcui/Chinese-LLaMA-Alpaca,该项目在 GitHub 有超过 15.8k Star,用一句话介绍该项目就是:“中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA...

阅读更多

只需 2 ~ 3 分钟从图像重建详细纹理的 3D 模型

在虚拟实境(VR)、增强实境(AR)和计算机图形领域,3D 模型是重要的元素。但制作质量高、细节丰富的 3D 模型需要专业知识和大量时间。对于那些希望快速、方便地生成 3D 模型的个人或团队,这就成了挑战。我们需要一个解决方案,可以基于单一视图图像快速生成高质量的 3D 模型。

GitHub 开源项目...

阅读更多

生成数字孪生画像的深度学习工具链

项目背景

随着现今数字生活的深化,我们的需求也在随之改变。让我们想象一个场景,你希望在数字世界中拥有一个属于你自己的“数字孪生”,它可以帮助你模拟真实世界中的各种场景,如试穿新出的服装款式,试用各种样式的美颜效果,甚至生成属于你的个性画像。然而,要实现这样一款工具,我们需要解决很多复杂的技术问题,包括但不限于面部模型的高精度生成、风格的精确控制、生成图片的高分辨率保持等。

GitHub 开源项目 modelscope/facechain,该项目在 GitHub 有超过 6.8k Star,用一句话介绍该项目就是:“FaceChain is a...

阅读更多

一个框架轻松微调各种 AI 大模型

在人工智能(AI)模型的开发过程中,通常需要对模型进行微调以适应特定任务和数据集。然而,各种模型的微调过程和配置各不相同,差异很大,涉及到的参数众多,微小的改变可能导致模型的性能有显著的差距。这使得微调成为一项耗时耗力却又关键至极的过程。如何用更少的时间和更低的复杂度细调模型,并在多个配置和架构中流畅无阻,是 AI 开发者一直在探索和实践的问题。

GitHub 开源项目 axolotl,该项目在 GitHub 有超过 2.8k Star,用一句话介绍该项目就是:“Go...

阅读更多

一套 SDK 无缝适配上百种大模型平台

项目背景

在繁琐的开发过程中,我们经常会遇到大量不同的 LLM API 调用需求,例如我们需要在 Bedrock、Azure、OpenAI、Cohere、Anthropic、Ollama、Sagemaker、HuggingFace、Replicate 等 100 多个 LLM 平台之间进行切换,而这些 LLM...

阅读更多

先进的开源文本转语音功能库

您是否在寻找一个低延迟、高性能的文本转语音(TTS)工具?是否遇到只能支持有限语言的问题,或者想要自己训练和微调模型?如果这些问题困扰着您,那么我想您会对以下这个项目感兴趣。

TTS 项目在 GitHub 有超过 24.4k Star,用一句话介绍该项目就是:“a deep learning toolkit for...

阅读更多

一个面向数据库的 DevOps 及 CI/CD 工具

在进行数据库开发及运维工作时,我们可能面临多个复杂问题,例如如何规范化数据库变更过程,如何控制数据访问,如何防止数据泄露,如何跟踪数据库中的各种行为,以及如何无缝迁移到新的数据库系统等。此外,我们也可能想要有一个全方位、端到端的数据库监控中心,能够监控数据库的所有异常、用户行为和系统事件等,但却不知道该如何去实现。

GitHub 开源项目 bytebase/bytebase,该项目在 GitHub 有超过 8.6k Star,用一句话介绍该项目就是:“World’s most advanced...

阅读更多

Meta 开源工具可以快速进行音乐创作

我们生活在一个充满音乐和声音的世界,每一首歌曲、每一个音效都在传递着一种情感或信息。然而,音频的处理和生成却是一件相对复杂的事情。为了生成高质量的音频,我们不仅需要懂得音乐的规则,还需要掌握专业的音频编码技术。现有音频处理工具通常不够灵活,不能根据用户的具体需求进行定制,这就给音频创作带来了很大的限制。

GitHub 开源项目 facebookresearch/audiocraft,该项目在 GitHub 有超过 17.8k Star,用一句话介绍该项目就是:“Audiocraft is a...

阅读更多

一条命令快速生成数据库文档

在日复一日的数据库开发和运维工作中,工程师们常常遇到如此困扰:如何高效详尽地记录数据库结构,以便于快速查询和定位问题?如果能有一款工具自动将数据库结构转化成详尽的文档,灵活又简便,岂不美哉?

GitHub 开源项目 k1LoW/tbls,该项目在 GitHub 有超过 2.8k Star,用一句话介绍该项目就是:“tbls is a...

阅读更多

生成 3D 画面原来可以这么简单

在现代数字艺术领域,3D 内容生成是一个重要且具有挑战性的课题。要真正实现精细的、高质量的 3D 模型创建,艺术家需要花费大量时间,并具备高级的技术技能和创新想象力。而且,从 2D 文本或图像生成 3D 内容常常需要各种类型的复杂和专业的工具,这在很大程度上限定了使用 3D 的用户数量。

今天要给大家推荐一个...

阅读更多

微软开源专注加快大模型推断速度

在大规模语言模型推理过程中,我们经常会面临几个问题:如何加快语言模型的推理速度;如何增强语言模型对关键信息的感知;如何压缩 prompt 提示和 KV-Cache。这些问题让人头痛,很多解决起来需要很多人力和资源投入。

今天要给大家推荐一个微软开源的项目 LLMLingua,该项目在 GitHub 有超过 1.2k Star,用一句话介绍该项目就是:“To speed...

阅读更多

开源的企业级问答系统

在当前大数据时代,充斥着海量的数据,当我们需要获取某些信息时,我们必须在多个不同的源头进行检索。这是一个非常耗时且低效的过程,使我们不得不将部分时间和精力用于查找信息,而非专注于解决实际问题。在这种情况下,我们需要一种工具,能够帮助我们针对性地获取数据,最好是能以人类的自然语言提问,内容源可以是我们日常工作中常用的私人资源,如 Slack、GitHub、Confluence 等。

GitHub 开源项目 danswer-ai/danswer,该项目在 GitHub 有超过 5.2k Star,用一句话介绍该项目就是:“Ask...

阅读更多

微信聊天记录提取与报告生成利器

在日常生活中,我们经常会遇到一些由于微信消息记录过多,导致无法快速找到一些重要信息的问题。此外,由于微信的储存方式,消息记录可能会在手机更换或者软件卸载之后丢失,让一些珍贵的、有价值的历史消息无法保存和回顾。再者,对于一些喜欢数据分析和自我反思的朋友们来说,微信聊天记录也是一个重要的信息来源,但微信并未提供类似统计功能,使得我们无法分析自己的社交行为。

GitHub 开源项目 WeChatMsg,该项目在 GitHub 有超过 16.6k Star,用一句话介绍该项目就是:“提取微信聊天记录,将其导出成 HTML、Word、CSV 文档永久保存,对聊天记录进行分析生成年度聊天报告”。

...

阅读更多

小红书图文/视频作品采集工具

现代社交网络充斥着各类丰富的内容,正是如此,我们才可以发现一些有意思的图文或者视频作品。然而,当我们遇见一些让人喜欢的作品,想要将其保存下来时,可能会发现由于作品存在水印,或在下载过程中出现各种问题,无法顺利的完成相应的操作。具体的问题,例如作品的文件的完整性处理问题,以及重复下载的问题,会浪费我们大量的时间和精力。那么,有没有一种工具能够自动化地、无水印地获取这些作品并且能够避免上述的问题呢?

GitHub 开源项目 XHS_Downloader,该项目在 GitHub 有超过 1.3k Star,用一句话介绍该项目就是:“免费;轻量;开源,基于 AIOHTTP 模块实现的小红书图文...

阅读更多

提升 K8S 的镜像拉取速度和容灾能力的镜像服务

在使用 Kubernetes 的过程中,每个节点在启动前都需要拉取工作负载的镜像,而运行在每个节点上的每个工作负载的副本都将会产生一个类似的镜像拉取操作。而这些镜像无论是从地理范围内靠近的云镜像服务还是公共的镜像服务,或自搭建的私有镜像服务,镜像的拉取都存在一定的跨网络访问的开销,会直接影响工作负载的启动速度,同时也增加了各节点之间的网络压力。

GitHub 开源项目 spegel,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“Stateless cluster...

阅读更多

注重隐私、轻量级的记事本服务

在日常工作和生活中,我们时常有很多想法和灵感闪现,但由于各种原因(比如手头没纸笔、事后忘记等),这些灵感往往就像过眼云烟一样消失不见。另外在团队协作时,我们可能会感到交流和共享信息的方式过于繁琐。这里就存在一个需求,那就是一个开源、轻量级、注重隐私的,且容易分享的记事本服务。

GitHub 开源项目 memos,该项目在 GitHub 有超过 21.3k Star,用一句话介绍该项目就是:“An open source,...

阅读更多

Golang 的超快安全轻量级的 Actor 引擎

在编写高并发的分布式系统时,常常会遇到许多挑战,如如何优化系统性能、如何降低系统应用延迟、怎样在遇到错误和故障时保证系统的稳健性等问题。为了克服这些挑战,卡尔·惠特在 1973 年引入了 Actor 模型。Actor 模型是一种计算模型,最基本的构建单位是 Actor,每一个 Actor 独立运行,通过发送接收消息与其他 Actor 交互,这种方式可以使系统具有高度的并发性和分布性。

...

阅读更多

特性开关标准库,适配所有语言

在当前的开发环境中,我们面临着一个重要的挑战,那就是如何在不同的技术栈(不同编程语言、编程框架等)中统一管理特性开关。这是一个普遍存在的问题,不论是小型创业公司还是大型企业,都会遇到。随着项目和团队的增长,亟需一种高效的方式来管理特性开关,降低了解不同库和工具的学习曲线,同时保持良好的兼容性和可扩展性。

GitHub 开源项目 OpenFeature,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“OpenFeature specification”。

阅读更多

Kubernetes 流量攻击图生成工具,针对性提供保护策略和预防措施

项目背景

在日常的 Kubernetes 集群管理和维护中,我们通常会遇到一大堆甚至可能无法预见的安全问题。一个不小心,就可能导致 Kubernetes 集群受到攻击,严重影响到公司的数据安全和业务稳定性。所以,我们急需一个工具,可以帮助我们更好的防范 Kubernetes 集群的安全问题,提前预计并主动防范。

GitHub 开源项目 DataDog/KubeHound,该项目在...

阅读更多

现代化 PHP 应用服务器,自动支持 HTTPS/HTTP2/HTTP3 等

PHP(Hypertext Preprocessor)是一种广泛应用的开源通用脚本语言,尤其适用于 Web 开发并可嵌入 HTML 中,但是创建和管理 PHP 应用程序服务器可能会非常复杂却又极其重要。尽管有其他一些已有的解决方案可以尽力简化这个过程,但事实并非如此,因为它们往往缺乏完整的功能,例如对 HTTP/2 和 HTTP/3...

阅读更多

少有人知道的 Go 实用工具集介绍

在今天的互联网时代,开源技术已经成为了推进技术发展的重要力量,开源项目更是为社区和公司提供了丰富的共享资源。然而,对于很多开发者来说,不断涌现的开源项目和新工具让他们头疼不已。如何找到并有效利用这些资源是一个亟待解决的问题。

GitHub 开源项目 go-recipes,该项目在 GitHub 有超过 3.1k Star,用一句话介绍该项目就是:“Tools for Go...

阅读更多

Meta 开源的代码大模型

在日常编程过程中,我们总会遇到诸多编程问题。微小的问题我们可以轻松解决,但对于大型的编程项目和复杂的问题,手动编程效率低且容易出错。同时,对于超大型输入的处理和编程任务的 zero-shot 指令跟踪,我们也总是力不从心。如果你正在寻找支持大型输入内容、具备编程任务 zero-shot 指令跟踪能力的模型,那么 Code Llama 是你的理想选择。

GitHub 开源项目...

阅读更多

DB-GPT - 一个用于数据库领域的大型语言模型开源框架

在数据 3.0 的时代,全球都在积极寻求利用大型语言模型(LLMs)来改善现有的工作流程,而软件工程是其中最为火热的一个领域。在软件研发过程中,数据库是最经常使用并且开发人员需要经常与之交互的工具,如何使得开发人员能够更快更好的与数据进行交互和数据分析,能够极大的提升软件研发的效率。但这一过程往往需要大量的代码编写和系统优化,在这个背景下,如何借助大语言模型的优势,使用最少的代码实现和数据库之间的高效互动应用成为了一大探索方向。

GitHub 开源项目 eosphoros-ai/DB-GPT,该项目在 GitHub 有超过 8.3k Star,用一句话介绍该项目就是:“Revolutionizing...

阅读更多

训练托管和评估大语言模型的开放平台

项目背景

在如今的各大公司,都开始了大语言模型的训练军备竞赛,而训练语言模型还是有不少的门槛的。在大规模语言模型(LLM)的开发和服务方面,对于一些刚起步的公司来说,缺乏一些专业的平台来进行训练,测试以及优化语言模型。另外,对于智能聊天引擎的评估,如何建立一个全面系统的评估标准和平台也十分必需。

GitHub 开源项目 lm-sys/FastChat,该项目在 GitHub 有超过 29.6k Star,用一句话介绍该项目就是:“An open platform...

阅读更多

nanoGPT - 每一个团队都需要训练一个大规模语言模型嘛?

在生成式人工智能领域,训练一个通用的大语言模型是非常耗费资源的,然而并不是所有领域都需要一个通用的模型。为了拓宽深度学习领域的应用,我们同时也需要一个简单的、易于上手的、并且能够快速训练中等规模 GPT (小型生成预训练模型)的开发工具,而这,正是我们面临的一项主要挑战。

GitHub 开源项目 karpathy/nanoGPT,该项目在 GitHub 有超过 26.4k Star,用一句话介绍该项目就是:“The...

阅读更多

FaceFusion - 下一代面部交换和增强工具

在当前社会的深度学习、面部识别技术高速发展的背景下,越来越多的个人和公司在创新、艺术、娱乐、安全等领域寻求面部融合技术。然而,找到一个高效、便捷、灵活的面部融合工具是令人挑战的。很多现有的工具无法处理复杂场景,缺乏灵活性,或者对技术技巧要求过高,阻碍了这项技术的普及。

GitHub 开源项目 facefusion/facefusion,该项目在 GitHub 有超过 9.1k Star,用一句话介绍该项目就是:“Next generation face...

阅读更多

LLMSurvey - 一个收集和整理有关大型语言模型的论文和资源的项目

由于大型语言模型(Large Language Models,简称 LLM)最近一年时间以来在自然语言处理等领域取得了显著的效果,许多研究人员和开发者开始关注和使用这些模型。然而,对于这类模型的研究论文和资源的查找和整理,同时跟踪 LLMs 的最新动态和发展趋势,是一项既耗时又繁琐的工作。LLMSurvey 这个开源项目,可以帮助我们解决上述问题。

GitHub 开源项目 RUCAIBox/LLMSurvey,该项目在 GitHub...

阅读更多

vLLM - 一个高吞吐量、内存高效的语言模型推理和服务引擎

在大语言模型(LLM)的应用领域,用户或开发者在机器学习服务过程中通常会遇到各种问题,例如:处理速度不够快、内存利用率不高、应用市面上流行的模型困难等。这些问题会大大影响项目的运行效率和用户体验,如果解决这些挑战,将大大优化大语言模型在企业上落地运用的流程。

GitHub 开源项目 vllm-project/vllm,该项目在 GitHub 有超过 10.3k Star,用一句话介绍该项目就是:“A high-throughput and...

阅读更多

OpenChat - 一款借鉴了离线强化学习策略的开源语言模型库

对于语言理解和聊天对话生成等各种应用场景,我们面临着如何不偏好任何标识,同时从混合质量的数据中进行学习的问题。传统的大型语言模型常常需要全程监督,在缺乏高质量标签的数据上可塑性并不高。虽然有一些预训练语言模型可供选择,但在聊天机器人等应用上的表现仍有待提升。

GitHub 开源项目 imoneoi/openchat,该项目在 GitHub 有超过 3.4k Star,用一句话介绍该项目就是:“OpenChat: Advancing Open-source...

阅读更多

Gofr - 简化微服务开发的编程框架

在微服务开发过程中,我们常常遇到各类问题。例如,REST 默认的标准难以践行、在企业级规模上的挑战、数据库状态管理、错误管理等等。以往,我们需要手动进行配置、对各个部分进行维护和测试。但随着 Gofr 的出现,这一切都可以得到解决。

GitHub 开源项目 gofr-dev/gofr,该项目在 GitHub...

阅读更多

Kubestack - 一个 Terraform 代码库中定义整个云原生技术栈

在如今云原生的浪潮下,Kubernetes 成为了云原生技术栈的核心。然而,对于很多的平台工程团队而言,我们所面临的问题有两个:一方面是使用 Terraform 为每个云厂商的 Kubernetes 平台都编写和维护一个独立的代码库,耗时且繁琐;另一方面则是将云原生的开发力量传递给全体工程团队,保证他们迭代安全,保护环境不受影响。

GitHub 开源项目 kbst/terraform-kubestack,该项目在 GitHub...

阅读更多

使用少量语音数据即可训练优秀的变声模型

随着深度学习技术的广泛应用,以及音频处理领域的持续发展,变声技术的需求越来越大。但是,使用深度学习训练优秀的变声模型通常需要大量的语音数据,一般是数小时甚至数十小时的语音数据才能得到相对满意的结果,这使得变声技术的应用受到一定的限制。因此,如何使用更少的语音数据(如小于10分钟)训练优秀的变声模型是一个迫切需要解决的问题。

GitHub 开源项目 RVC-Project/Retrieval-based-Voice-Conversion-WebUI,该项目在 GitHub 有超过 13.7k Star,用一句话介绍该项目就是:“Voice data <=...

阅读更多

CogVLM - 一款清华开源的视觉语言模型

在当前复杂的视觉和语言任务中,我们需要开发一个模型,能够精准地对图像内容进行描述,并能理解并回答各种类型的问题,为此,清华大学自然语言处理与社会人文计算实验室开源了一款对应的项目 CogVLM。

GitHub 开源项目 THUDM/CogVLM 在 GitHub 有超过...

阅读更多

ComfyUI - 模块化的 stable diffusion 流程化编排界面

在处理图像、视频或其它 stable diffusion 数据过程中,我们需要设计和执行复杂的 stable diffusion 流程。然而由于它的复杂性,我们可能需要编写大量的代码来实现。更为麻烦的是,应对不同数据或不同类型的流程,我们又要做出相应的调整或重头编写。那么,有没有一种方法,既能简化这种复杂的流程设计,又能根据不同的需求轻松调整流程呢?

GitHub 开源项目 comfyanonymous/ComfyUI,该项目在...

阅读更多

loom - 一个基于树形结构的写作界面

在人工智能与人类的协同创作中,如何有效地处理文本内容,同时提供一个交互性强、用户体验良好的界面,一直是一个主要的挑战。

GitHub 开源项目 socketteer/loom,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“Multiversal tree writing...

阅读更多

Generative Models - 用生成模型处理图像和视频

当我们需要用到生成模型来创建新样本,处理图像,视频等数据,或要预测特定输入的可能输出时,那么 Generative Models by Stability AI 是您需要的解决方案。它是面向研究目的的创新开源工具,专注于图像和视频生成。

GitHub 开源项目 Stability-AI/generative-models 在...

阅读更多

Polaris - 一款模块化的 EVM 实现方案,简化区块链应用开发的复杂度

在区块链技术蓬勃发展的今天,越来越多的项目寻求借助以太坊虚拟机(EVM)的优越特性来实现自身项目的特色功能,如完备的智能合约系统设计。然而如何将 EVM 顺畅的集成至项目中成为了一大制约。开发者们需要投入大量的时间和精力才能完成这一硬核任务,而且难度高、易出错。即使如此,实现的效果也常常无法满足需要。因此当下,我们急需一个模块化的 EVM 实现方案,能够轻松地集成至任何共识引擎或应用中。

GitHub 开源项目 berachain/polaris,该项目在 GitHub 有差不多...

阅读更多

XAgent - 大型语言模型(LLM)驱动的自主代理项目,旨在自动解决各种复杂任务

在当前复杂的任务处理中,我们通常会遇到需要自动化处理各种各样任务的问题,这些问题可能涉及到任务的管理、求解方案、以及与工作环境的交互等,每一个环节分别需要不同的技术融合,在处理过程中需要耗费大量的人力和物力。这时,如果有一款能够安全、自动地进行各类任务处理的工具,无疑将会大大地提高工作的效率。

GitHub 开源项目 OpenBMB/XAgent,该项目在 GitHub 有超过 5.2k Star,用一句话介绍该项目就是:“An Autonomous LLM...

阅读更多

Open Assistant - 在强化的数据隐私保护下更好的使用大模型

在开发过程中,我们常常需要和各种 AI 助手打交道,以实现各种复杂的任务。然而,许多现有的 AI 助手都有一个共同的问题,即它们都需要在线环境来完成代码执行,并且需要将我们的文件上传到 AI 提供商的服务器上。这样不仅带来了数据隐私、文件大小和数量限制以及基于云的费用等问题,而且在很大程度上限制了开发者的操作灵活性。

GitHub 开源项目 YORG-AI/Open-Assistant,该项目在...

阅读更多

LatentConsistencyModels - 通过少量步骤生成高分辨率图像的强大工具

在很多应用场景中,例如游戏开发、电影特效制作等,我们通常需要根据一些以文本形式给出的场景描述,生成对应的高分辨率图像。然而,由于语言与视觉信息之间的复杂关系,这是一个非常具有挑战性的任务。许多现有的模型需要大量的计算资源,且常常需要经过大量的迭代和优化才能生成满意的结果。在这种情况下,Latent Consistency Models (潜在一致模型)应运而生,这是一个能够快速生成高分辨率图像的模型。

GitHub 开源项目 luosiallen/latent-consistency-model 在 GitHub 有超过 2.1k...

阅读更多

GraphCast - Google DeepMind 开源的气象预测模型,专为全球中远期天气预测设计

在气候预测和研究中,我们经常遇到的一个问题是对全球气候变化的中远期预测。由于气候系统的复杂性和数据的大量性,我们通常依赖复杂的数值气候模型来进行预测。然而,这些模型不仅需要大量的计算资源,而且在预测中也可能存在误差,使得我们的预测结果可能偏离实际情况。鉴于此,我们急需一个高效且准确的气候预测工具,用以解决目前的痛点。

GitHub 开源项目 google-deepmind/graphcast,该项目在 GitHub 有超过 1.6k Star,该项目就是尝试解决以上问题。

阅读更多

tRPC-Go - 一个灵活、高性能的 RPC 框架

在分布式系统领域,RPC(远程过程调用)协议被广泛应用在跨机器和跨进程的通信中,但是传统的 RPC 协议无法满足我们需求,如高性能和易扩展性。tRPC-Go 就是这样一个针对现代服务化开发需求而设计的开源项目。

GitHub 开源项目 trpc-group/trpc-go 在 GitHub 有差不多 1000...

阅读更多

Waveny - 专为模拟吉他而设计的放大器和效果器

在现今的音乐创作环节中,吉他音色和效果器的应用极大的丰富了音乐表达的形式和内容。然而,实际录音环境及设备对于大多数创作者来说无疑增加了创作难度和成本,如何在不影响音效质量的前提下,实现更便携、更低成本的吉他效果,你有什么办法没有?

GitHub 开源项目 nlpodyssey/waveny,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“Emulate guitar amps...

阅读更多

Kubeshark - 一个专为 Kubernetes 设计的 API 流量分析器

在使用 Kubernetes 进行微服务管理的过程中,我们常常会遇到一些诸如服务间通信失败、请求延迟高昂或丢包等网络问题,然而 Kubernetes 的内部网络环境极为复杂,各个服务间的通信都通过协议进行,此时我们需要一个工具能够实时监控 Kubernetes 中的网络通信,并能在问题出现时尽快发现和定位问题。

GitHub 开源项目 kubeshark/kubeshark,该项目在...

阅读更多

ChatGLM3 - 智谱 AI 和清华大学 KEG 实验室联合发布的新一代对话预训练模型

在当今以信息为主导的社会,人们从未像现在这样对语言对话技术有着如此高的期待。无论是用于家居语音助手,还是在线客户服务,甚至是用于复杂任务的机器人对话系统,高效准确的语言模型处理和理解能力都是至关重要的。然而,现有的对话语言模型往往不具备足够的效率和精度,且部署门槛较高,难以适应各类复杂场景。这使得我们对更加强大,完整并易于使用的对话语言模型有着迫切的需求。

GitHub 开源项目 THUDM/ChatGLM3,该项目在 GitHub 有超过 4.9k...

阅读更多

The Alignment Handbook - 大语言模型训练最佳实践手册

在人工智能语言模型的领域,我们每时每刻都在寻求更准确、更有效的模型来理解和生成人类语言。然而,对于如何让这些模型更好地与人类或 AI 的偏好对齐,现有的方法还不够丰富和翔实。在这样的背景下,通过人工反馈进行强化学习(RLHF)的技术造成了很大的反响。但是,尽管这类模型在帮助和安全性方面有显著的提升,但要将其与一系列的偏好进行对齐还是一种相对新颖的想法,现在业界可供参考的资源也很少。

GitHub 开源项目 huggingface/alignment-handbook,该项目在 GitHub 有超过 1.8k Star,用一句话介绍该项目就是:“Robust...

阅读更多

EmotiVoice - 网易有道开源强大且现代化的文本转语音引擎

在数字化语音的领域中,我们经常会遇到一个问题:怎么样能降低机器生成语音的机械性,增强情感色彩。比如在任何需要语音互动的场合,如智能语音助手、导航、儿童故事机、电台等,更真实且多样化的语音会极大提升用户体验。这就是我们需要解决的痛点。

GitHub 开源项目 netease-youdao/EmotiVoice,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“EmotiVoice 😊: a...

阅读更多

OpenAI_Agent_Swarm - 利用 OpenAI 创建自组织、遵循道德规则的 AI 代理生态系统

在现今的开发环境中,我们常常会面临到需要让大量智能代理并行操作以提高效率的挑战。然而,管理这方面的过程相当复杂,控制拥有不同的目标和任务优先级的智能代理队伍往往是开发者的一项繁重工作。与此同时,确保每个智能代理遵循正确的行为模式并且与其他代理良好协作是另外一个需要克服的难点。

GitHub 开源项目 daveshap/OpenAI_Agent_Swarm,该项目在 GitHub 有超过 1.9k Star,用一句话介绍该项目就是:“HAAS = Hierarchical...

阅读更多

Go-blueprint - 一款帮助 Go 开发者轻松启动新项目的脚手架工具

在进行 Golang 项目开发时,我们常常会被初始化项目的繁琐步骤所困扰,尤其是当项目框架复杂、模块繁多的时候,令人头疼,比如:搭建项目结构、设置 HTTP 服务器、集成流行的 Golang 框架等等。这些重复且机械的工作,极度消耗我们的时间与精力,使得我们无法更专注于应用程序的业务代码编写。

GitHub 开源项目 Melkeydev/go-blueprint,该项目在...

阅读更多

Whisper - 一个 OpenAI 开源用于语音识别的通用模型

在音频识别和翻译领域,我们常常会遇到一些问题,比如:音频数据多元化和多语种处理的困难,传统的音频处理流程复杂繁琐,一些阶段性的处理结果需要进行手动连接和调整。有效的自动语音识别(ASR)系统对于全球交流和语言辅助系统至关重要,比如智能语音助手、电话语音翻译等方面。然而,设计一个可以广泛适用于各种任务,如多语言、语音翻译和语言识别的模型仍然是具有挑战性的。对于这些困扰我们的问题,一个来自 OpenAI 的开源项目 —— Whisper,或许能提供我们新的解决方案。

GitHub 开源项目 openai/whisper,该项目在 GitHub 有超过 48.7k...

阅读更多

vimGPT - 采用 GPT-4V 视觉模型,配合 Vimium 互联网浏览

在我们浏览网络的过程中,时常需要不断地切换鼠标和键盘进行操作,使得网络交互过程变得复杂。同时,对于视障人士来说,网络浏览更加困难。那么能否有一种方式,让我们只需使用键盘就能流畅地浏览网络,并且充分利用剪贴板和各类模型进行多模态交互呢?

GitHub 开源项目 ishan0102/vimGPT,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“Browse the web...

阅读更多

GoMock - Google 开源并由 Uber 持续维护的 Go 测试 Mock 框架

在进行 Go 语言的开发过程中,我们会碰到需要实现模拟功能来对各种接口进行测试。然而,手动实现模拟接口是一个既繁琐又容易出错的过程,在一般的测试流程中,我们一般会配合使用一些 Mock 框架。那么问题来了,Go 语言中有哪些这样的框架?

GitHub 开源项目 uber-go/mock,该项目在 GitHub...

阅读更多

Go OpenAI - 一款开源的 OpenAI API 的 Go 语言客户端

在我们的工作和日常生活中,人工智能已经渗透入了各个角落。从智能手机的语音助手,到各种自动化的客户服务。然而,工作来接入这些人工智能应用的过程,特别是涉及复杂的对话模型和生成模型时,常常会让开发者头疼。既要保证模型的性能和准确性,又必须处理众多的与接口相关的细节问题。而 Go 语言因其简洁、现代和快速的特点,已被广泛应用在各类高并发的服务开发中。所以,如果能有一款 Go 语言版本的 OpenAI API 客户端,将会极大方便众多 Go 开发者。

今天要给大家推荐一个...

阅读更多

ko - 无需依赖 Docker,简单且快速的 Go 应用容器镜像构建工具

在云原生应用的开发部署中,Go 语言由于其良好的并发性能和运行效率,越来越受到开发者的青睐。但是,构建 Go 应用的容器镜像却常常会遇到诸如:构建过程慢、依赖 Docker 服务、操作复杂以及无法方便的实现多平台构建(multi-platform builds)等问题。那么,如何快速、简单地构建和部署 Go 应用的容器镜像,成为了一个值得深入研究的问题。

GitHub...

阅读更多

System Design 101 - 使用直观视觉效果和简单语言来解释复杂的系统设计

随着互联网技术的快速发展,复杂的后台系统设计对于程序员来说几乎已经成为了他们每天都需要面对的问题。然而,无论是新手还是经验丰富的工程师,都会碰到一些困扰。原因多种多样,既包括信息架构复杂难以理解,又有实时技术更新导致的知识滞后等。这就需要有一种工具或者方法能够帮助我们更好地理解、学习和应对这类问题,System Design 101 便是这么一款工具。

GitHub 开源项目 ByteByteGoHq/system-design-101,该项目在 GitHub...

阅读更多

一款为家庭打造的简单易用的私有照片云服务

在这个电子时代,我们每时每刻都在产生各种类型的多媒体内容,从手机拍摄的高清照片到录下的生活短片。数据量的不断增长以及通过不同设备进行访问产生的复杂性,让我们在处理这些数据时面临重大挑战。尤其是家里有小孩的家庭,小孩的照片视频比较多,而且部分老人可能对手机的操作也不是很熟练。因此,我们需要一个便捷、高效的方法来自动备份、分析和管理这些数据,以便我们可以最大程度地利用和留存它们。

GitHub 开源项目 lomorage/homepage,该项目在 GitHub 有差不多 1000 Star。我自己也在使用,非常推荐。

阅读更多

Immich - 一款高性能的自托管照片、视频备份解决方案

在当前智能设备盛行的世界,我们常常会用手机拍摄众多的照片和视频,其中可能包含着珍贵的回忆和重要的信息。然而,手机的存储空间有限,一来就很可能会因为存储空间不足而造成资料丢失;二来如果手机丢失或损坏,未备份的照片、视频等资料可能会无法找回。对此,市面上虽然有各种云服务提供备份解决方案,但在数据安全和隐私保护方面总存在一些担忧。这时,如果有一款自主托管的照片、视频备份解决方案,可以直接从你的移动设备进行备份,那将非常有助于解决这类问题。

GitHub 开源项目 immich-app/immich,该项目在 GitHub 有超过 20.5k Star,用一句话介绍该项目就是:“Self-hosted photo and...

阅读更多

DeepSpeed - 微软开源的强大深度学习优化库

在深度学习领域,我们经常面临着训练大规模语言模型的挑战。这些模型具有数十亿或数万亿个参数,而传统的训练方法在效率和速度上往往表现欠佳。为了解决这个问题,Microsoft 开发了 DeepSpeed,一个易于使用的深度学习优化软件套件,为训练和推理提供了前所未有的规模和速度。

GitHub 开源项目 microsoft/DeepSpeed 在 GitHub 有超过 29.4k Star,用一句话介绍该项目就是:“DeepSpeed...

阅读更多

DocsGPT - 旨在简化项目文档搜索体验

在开发过程中,经常会遇到需要查找项目文档中的信息的问题。但是,手动搜索文档耗时且不高效。针对这个问题,项目 DocsGPT 应运而生。DocsGPT 是一个开源的文档助手,通过集成强大的 GPT 模型,开发人员可以轻松地在项目中提问,并获取准确的回答。让我们告别繁琐的手动搜索,让 DocsGPT 帮助您快速找到所需的信息。尝试一下,看看它如何革新您的项目文档体验。

GitHub 开源项目 arc53/DocsGPT...

阅读更多

pix2tex - 通过 OCR 将数学公式的图像转换为相应的 LaTeX 代码

在数学领域,将手写公式转换为 LaTeX 代码是一个常见的需求。然而,手动转换费时费力且容易出错。为解决这一问题,pix2tex 项目应运而生。该项目旨在创建一个基于学习的系统,可以接收数学公式的图像并返回相应的 LaTeX 代码。

GitHub 开源项目 lukas-blecher/LaTeX-OCR,该项目在 GitHub 有超过...

阅读更多

GPT Pilot:让开发人员20倍快速构建应用的开发工具

在开发应用程序时,我们往往会遇到许多重复且繁琐的工作,例如编写产品和技术需求、设置开发环境以及编码应用程序。GPT Pilot 是一款旨在解决这些问题的开发工具,它可以以真实的开发流程逐步编写应用程序,让你作为技术领导进行开发过程的监督与审核。

GitHub 开源项目 Pythagora-io/gpt-pilot 在 GitHub 有超过 14.6k Star,用一句话介绍该项目就是:“Dev tool that...

阅读更多

DetectDee 通过多种方式(用户名、电子邮件或电话)帮助用户搜索社交网络上的账户

在现今社交媒体盛行的时代,人们经常需要查找某个人在不同社交网络上的账户。然而,由于网络平台众多且分散,手动搜索成为一项繁琐且耗时的工作。此外,对于网络安全从业人员而言,了解账户在不同社交媒体上的存在与否也是一项重要的任务。

GitHub 开源项目 piaolin/DetectDee,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“DetectDee: Hunt down...

阅读更多

Numaflow - 基于 Kubernetes 的平台,用于运行大规模并行的数据/流处理作业平台

在处理大规模并行数据/流处理作业时,我们常常面临着一些挑战。首先,要将数据处理分布到多个节点上,需要创建复杂的作业调度和管理机制。其次,在数据处理过程中,我们需要确保数据的完整性和准确性。此外,还需要对作业执行进行监视和调优,以保证高效和稳定的运行。以上问题如果要自己去解决,有不小的开发成本。

GitHub 开源项目 numaproj/numaflow,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“Kubernetes-native platform to...

阅读更多

Caretta - 快速创建 Kubernetes 集群中服务的可视化依赖图

随着 Kubernetes 的广泛应用,对 Kubernetes 集群中微服务的管理和监控需要更高效的工具。传统的分析工具需要手动配置,有时对系统的资源占用过大,不仅耗时,而且可能影响系统性能。而我们等待的,是一款能够实时生成 Kubernetes 服务依赖图的工具,它需要能轻松地集成到 Grafana,同时对系统资源的占用尽可能的小。Caretta 实现了这些需求,而且还具备独特的设计理念。

阅读更多

低维护的自托管电子邮件服务器

对于大部分公司来说,可能会面临一个重要问题:如何在自我托管的环境中维护一个安全,易于维护,现代设计的邮件服务器?如果你正在寻找一个方便易用的方式,基于 Mox 开源项目构建的邮件服务器可能是你的答案。为你提供多项现代化全功能服务,满足你的邮件发送、接收、访问等各种需求。

GitHub 开源项目 mjl-/mox,该项目在 GitHub...

阅读更多

TableFlow - 一个开源的 CSV 数据导入管理平台

在日常的数据处理过程中,我们经常会遇到需要将 CSV 或者 Excel 文件的数据导入到我们的应用中,并且保证数据的映射和准确性。同时还需要确保对文件的主动修改,以及数据的验证。但是在实际的操作过程中,这样的问题并不能得到很好的解决。接下来,让我来向大家介绍一个能够解决这类问题的开源工具 —— TableFlow。

GitHub 开源项目 tableflowhq/tableflow,该项目在 GitHub...

阅读更多

pgrok - 针对小团队的多租户反向代理

在进行软件开发、远程协作和产品测试阶段时,开发团队或许会面临一个问题,如何将本地的开发环境稳定且安全的提供给公网的其他用户进行访问?这其中涉及到了自己搭建反向代理的问题,以及项目如何对接单点登录服务提供商等一系列问题。

GitHub 开源项目 pgrok/pgrok,该项目在 GitHub 有超过...

阅读更多

Kor - 探察和发现 Kubernetes 中未使用的资源

随着微服务的普及,我们越来越依赖 Kubernetes ( K8s ) 这样的容器编排工具进行部署。然而,在日常使用过程中,我们常常会遇到一个问题 —— 如何有效地找出并管理未使用的 Kubernetes 资源?这些包括 ConfigMaps、Secrets、Services、ServiceAccounts...

阅读更多

Dolt - Git 和 MySQL 的结合体,提供版本控制的数据管理工具

在时代进步的同时,大量的数据涌现出来,管理这些数据并存储其变化历史变得越来越复杂,我们需要一个能够记录、追踪和管理数据变更历史的工具。同时,我们还期望这个工具能够像操作 Git 仓库一样方便,使得我们可以轻易地 fork、clone、branch、merge,push 和 pull 等操作。

GitHub 开源项目 dolthub/dolt,该项目在...

阅读更多

Templ - 一种更好的管理 HTML 模板的 Go 语言框架

在开发 Web 应用时我们常常需要写 HTML 代码以构建用户界面。然而,创建和管理 HTML 模板可能会变得非常复杂和困难,特别是在大型项目中。要优化并整理这些模板代码,我们需要一个强大且易于使用的模板语言。这种需求在使用 Go 语言开发 Web 应用时尤为突出,因为...

阅读更多

Fleek - 一个全能的电脑 Home 环境管理系统,适配主流操作系统

在我们的日常编程工作中,我们常常需要在不同的电脑设备上进行操作,常见的比如工作和家庭电脑的切换,但是每次更换设备时,我们都需要重新配置我们的工作环境,这无疑增加了我们的工作负担。同时,我们可能还需要安装各种各样的软件和工具,但是在不同的操作系统中,这些软件和工具的安装过程可能会有所不同,这也给我们带来了一定的困扰。这时候,我们就需要一个能够帮助我们快速搭建工作环境,同时支持各种软件和工具安装的工具。

GitHub 开源项目 ublue-os/fleek,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“Own your $HOME”。

...

阅读更多

Evilginx - 一个用于钓鱼攻击的中间人攻击框架

在网络安全领域,钓鱼攻击一直是一个棘手的问题。攻击者通过伪造网站,诱导用户输入登录凭证,从而窃取用户信息。尽管现在大多数网站都采用了两步验证(2-factor authentication)的方式来提高安全性,但是这并不能完全阻止钓鱼攻击。因为攻击者可以通过中间人攻击(Man-in-the-middle attack)的方式,获取到用户的登录凭证和会话cookie,从而绕过两步验证。这就是我们需要关注的核心问题。

GitHub 开源项目 kgretzky/evilginx2,该项目在 GitHub 有超过 8.6k Star,用一句话介绍该项目就是:“Standalone...

阅读更多

ChatDev - 一个基于大型语言模型 (LLMs) 的虚拟软件公司

在当今的软件开发过程中,我们经常会遇到各种问题,如需求分析、设计、编码、测试、文档编写等环节的复杂性和繁琐性,这些问题往往会影响到软件开发的效率和质量。同时,我们也期望能有一种方式,能够通过自然语言的方式,快速地生成定制化的软件。这就是我们今天要介绍的开源项目 ChatDev 要解决的问题。

GitHub 开源项目 OpenBMB/ChatDev 在 GitHub 有超过 16.0k Star,用一句话介绍该项目就是:“Create...

阅读更多

RedPajama-Data - 专门用于准备训练大型语言模型的大数据集

在大规模语言模型的训练过程中,我们常常会遇到如何准备大量数据集的问题。这个问题的核心痛点在于,如何从海量的文本文档中筛选出高质量的数据,并进行去重处理,以便于训练出更准确的语言模型。

GitHub 开源项目 togethercomputer/RedPajama-Data,该项目在 GitHub 有超过 3.7k Star,用一句话介绍该项目就是:“The RedPajama-Data repository...

阅读更多

大语言模型的研究和应用开发者的必备工具

在大型语言模型的研究和应用中,我们经常会遇到如何方便快捷地进行模型交互、模型切换、模型训练等问题。同时,对于不同的模型,我们可能需要不同的界面模式进行交互,如默认模式、笔记本模式和聊天模式等。这些问题的存在,使得我们在进行大型语言模型的研究和应用时,需要花费大量的时间和精力在模型交互和管理上。

GitHub 开源项目 oobabooga/text-generation-webui,该项目在 GitHub 有超过 26.0k Star,用一句话介绍该项目就是:“A Gradio web...

阅读更多

MemGPT - 一个智能的大模型记忆管理系统,提供大量的上下文长度信息支持

在今天的信息化社会,我们每天都会接触到大量的数据和信息,如何有效地管理和利用这些数据成为了一个重要的问题。同时,随着人工智能技术的发展,大语言模型能够帮助我们更好地与数据进行交互,但是其支持的上下文容量是有限的,会导致我们并不能充分运用已经拥有的数据和信息,上下文长度受限是一个急需解决的问题。例如,我们是否可以在与大模型聊天的过程中,也能同时去查询数据库,或者与本地文件进行交互。

GitHub 开源项目 cpacker/MemGPT,该项目在 GitHub 有超过 5.2k Star,用一句话介绍该项目就是:“Teaching LLMs memory...

阅读更多

GPT Academic - 专门为学术研究而优化的大模型实用化交互项目

在我们的学术研究过程中,经常会遇到一些问题,比如阅读英文论文的难度、论文的润色和写作、代码的解析等。这些问题可能会消耗我们大量的时间和精力,而且如果没有足够专业的知识和技能,可能还会影响我们的研究效果的进展。因此,我们需要一个工具,能够帮助我们解决这些问题,提高我们学术研究的效率。

GitHub 开源项目 binary-husky/gpt_academic,该项目在 GitHub 有超过 44.6k Star,用一句话介绍该项目就是:“为 ChatGPT/GLM 提供实用化交互界面,特别的优化论文阅读/润色/写作体验,支持...

阅读更多

VideoReTalking - 根据输入的音频编辑真实世界中的讲话人视频的面部表情

如果你是一个视频相关的工作人员,遇到需要对视频进行编辑的情况,尤其是对于讲话人的视频,需要去改变视频中讲话人的语音或者情绪时,如何让视频中的嘴唇动作与新的语音同步,这就成为了一个难题。这个问题的核心痛点在于,我们需要在保持视频质量的同时,实现对讲话人嘴唇动作的精准编辑,以达到与新的语音同步。

GitHub 开源项目 OpenTalker/video-retalking,该项目在 GitHub 有超过 2.8k Star,用一句话介绍该项目就是:“[SIGGRAPH Asia 2022]...

阅读更多

在命令行终端本地运行的 OpenAI 代码执行器

在我们的日常编程工作中,经常会遇到一些复杂的编程问题,比如创建和编辑图片、视频、PDF 等,控制 Chrome 浏览器进行自动化处理,处理和分析大型数据集等。这些问题需要我们具备丰富的编程知识和经验,而且在解决问题的过程中,我们可能需要花费大量的时间和精力。那么,有没有一种工具,可以帮助我们以自然语言的方式来运行代码,从而更高效地解决这些问题呢?

GitHub 开源项目 KillianLucas/open-interpreter,该项目在 GitHub 有超过 31.3k...

阅读更多

Opengist - 一个开源可替代 GitHub Gist 的代码片段分享工具

在我们的日常开发工作中,经常会遇到需要分享代码片段的情况,而 GitHub Gist 是一个非常好的选择。然而,GitHub Gist 是一个闭源的服务,我们无法自行部署和定制。这就是我们需要一个开源、可自我托管的代码片段分享工具的原因。而 Opengist 正是为了解决这个问题而诞生的。

GitHub 开源项目...

阅读更多

Nap - 一个命令行终端下的代码片段管理工具

在我们的编程过程中,经常会遇到一些重复的代码片段,或者是一些灵光一现的创新点,比如试一下某个库的运行效果、写一个简单算法题等,这些都是我们希望能够快速保存和调用的。然而,传统的代码片段管理工具往往需要离开终端环境,这无疑打断了我们的编程思路。因此,我们需要一个能够在终端环境下快速创建和访问代码片段的工具,这就是今天推荐项目尝试要解决的。

GitHub 开源项目 maaslalani/nap,该项目在 GitHub 有超过...

阅读更多

kubectl-ai - 快速生成并 Kubernetes manifests 的 AI 应用

在日常的开发和测试过程中,我们常常需要找到并收集各种 Kubernetes manifests,这个过程既繁琐又耗时。而且,由于 Kubernetes 的复杂性,我们往往需要花费大量的时间和精力去理解和编写这些 manifests,这非常影响日常的开发和测试的效率。

GitHub 开源项目 sozercan/kubectl-ai,该项目在 GitHub...

阅读更多

ScratchDB - 一个简单易用可直接处理 JSON 数据的数据库系统

在大数据时代,我们经常会遇到需要处理大量的 JSON 数据并进行分析查询的需求。然而,传统的数据库系统如 BigQuery、Redshift、Snowflake 等,虽然功能强大,但是使用起来可能会有一些复杂,同时也需要承担一定的成本。如果你正在寻找一个开源的、易用的、能够处理大量 JSON 数据的数据库系统,不妨看看今天的项目的推荐。

GitHub 开源项目 scratchdata/ScratchDB,该项目在...

阅读更多

Odigos - 一个能够无需改动代码为任何应用程序生成分布式追踪的工具

在日常开发过程中,我们经常会遇到需要对应用程序进行分布式追踪的需求,但是这往往需要对代码进行改动,这无疑会增加开发的复杂性和工作量。特别是对于 Go 等编译型语言,无需代码改动的自动化工具更是少之又少。同时,我们还需要将收集到的数据与现有的观察工具进行整合,这也是一项繁琐的工作。

GitHub 开源项目 keyval-dev/odigos,该项目在 GitHub 有超过 1.9k Star,用一句话介绍该项目就是:“Distributed...

阅读更多

Invoice - 一个命令行快速发票生成器

在我们的日常工作中,经常会遇到需要生成发票的情况。然而,传统的发票生成方式往往需要我们手动填写大量的信息,这不仅耗时耗力,而且容易出错。此外,如果我们需要生成大量的发票,这种方式更是无法满足我们的需求。因此,我们需要一个能够自动化生成发票的工具。

GitHub 开源项目 maaslalani/invoice,该项目在 GitHub 有超过 1.4k Star,用一句话介绍该项目就是:“Command line invoice...

阅读更多

pgroll - 为 PostgreSQL 提供安全零宕机且可逆的数据库迁移方案

在 PostgreSQL 数据库的日常运维中,我们常常会遇到需要进行数据库迁移的情况。然而,传统的数据库迁移方式往往需要停机,这对于需要 24 小时不间断运行的业务来说,无疑是一种巨大的困扰。另外,如果迁移过程中出现问题,往往需要花费大量的时间和精力来进行回滚,这无疑增加了运维的难度和风险。因此,如何实现零停机时间的数据库迁移,以及如何快速回滚迁移操作,成为了我们面临的核心问题。

GitHub 开源项目 xataio/pgroll,该项目在 GitHub 有超过...

阅读更多

tssh - 一个支持批量选择/登录服务器的 ssh 客户端

在日常的服务器管理工作中,我们常常会遇到一些问题,比如需要批量登录到多台服务器进行操作,但是每次都需要手动输入密码,这无疑增加了我们的工作负担。同时,我们可能还需要在服务器之间传输文件,但是传统的 ssh 文件传输工具速度较慢,无法满足我们的需求。这时候,我们就需要一个能够解决这些问题的工具。

GitHub 开源项目 trzsz/trzsz-ssh,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“支持...

阅读更多

Copacetic - 基于 buildkit 的容器镜像漏洞修补工具

在我们的日常工作中,可能会遇到这样的问题:当容器镜像出现安全漏洞时,我们需要快速修补,但是往往需要等待上游进行全面重建,这样的时间窗口可能会导致漏洞被积极利用。特别是当这些漏洞来自于深层次的基础镜像,或者是你并不维护的第三方应用镜像时,等待更新发布的时间可能会超出你的安全服务等级协议。

GitHub 开源项目 project-copacetic/copacetic,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“CLI tool for...

阅读更多

CodeGPT - 帮助编写 git commit 信息或进行代码审查的命令行工具

在日常的代码开发过程中,我们经常会遇到需要编写 git commit 信息或进行代码审查的情况。然而,这些任务往往需要花费大量的时间和精力,而且在编写 commit 信息时,我们还需要遵循一定的规范,这无疑增加了我们的工作负担。此外,对于代码审查,我们需要对代码的改动进行详细的分析和理解,这对我们的专业知识和经验要求非常高。

GitHub 开源项目 appleboy/CodeGPT,该项目在 GitHub...

阅读更多

obligator - 专为自托管者设计且简单的 OpenID Connect (OIDC) 服务工具

在日常的开发和运维工作中,我们经常会遇到需要自建 OpenID Connect (OIDC) 服务的需求。然而,市面上的开源 OIDC 服务器虽然众多,但往往不能满足我们对于特定功能组合的需求,比如简单的部署和管理、支持匿名 OAuth2 客户端认证、支持多域名同时认证、无密码邮箱登录等等。这些问题的存在,使得我们在实际操作中经常感到困扰。

GitHub...

阅读更多

Hanko - 一个开源的身份验证和用户管理解决方案

在当前的数字化时代,密码管理成为了每个人都要面临的问题。我们需要记住各种各样的密码,从社交媒体账户,到银行账户,再到工作邮箱,密码的数量令人头疼。然而,密码的安全性也是一个大问题,一旦密码被泄露,我们的个人信息就可能面临风险。因此,我们需要一种更安全,更便捷的身份验证方式。

GitHub 开源项目 teamhanko/hanko,该项目在 GitHub 有超过 4.5k Star,用一句话介绍该项目就是:“Open authentication and...

阅读更多

Log - 一个简洁且多彩的 Go 语言日志库

在日常的开发工作中,我们经常需要记录程序运行过程中的各种信息,以便于我们了解程序的运行状态,发现并解决问题。然而,标准的日志库通常功能单一,输出格式单调,缺乏人性化的设计,使得我们在查看日志时需要花费大量的时间和精力。因此,我们需要一个功能强大,易于使用,输出格式丰富多彩的日志库,来提高我们的开发效率。

GitHub 开源项目 charmbracelet/log,该项目在 GitHub 有超过 1.5k Star,用一句话介绍该项目就是:“A minimal, colorful...

阅读更多

Higress - 阿里巴巴基于内部两年多实践沉淀的下一代云原生网关

在云原生架构的背景下,我们需要一个能够满足微服务、安全防护以及流量管理等多重需求的网关,同时,我们还希望这个网关能够轻松地与现有的系统进行集成,而不是需要我们进行大规模的改造。

GitHub 开源项目 alibaba/higress,该项目在 GitHub 有超过 1.8k...

阅读更多

Mods - 一个基于命令行专为管道设计的人工智能工具

在我们的日常工作中,我们经常会使用命令行来执行各种操作,但是有时候我们可能会遇到一些问题,比如如何解析命令的输出,如何将这些输出以友好的方式展示出来,或者如何在命令行中使用人工智能等。这些问题可能会让我们的工作变得复杂和困难。

GitHub 开源项目 charmbracelet/mods,该项目在 GitHub 有超过 1.7k Star,用一句话介绍该项目就是:“AI on the...

阅读更多

snips.sh - 一个 SSH 驱动的无密码、匿名的代码分享剪贴板

在日常的开发工作中,我们经常需要分享代码片段,但是传统的方式如邮件、即时通讯工具等,不仅操作繁琐,而且无法保证代码的格式和高亮,给阅读带来困扰。同时,对于一些敏感信息,我们希望能有一种方式能够实现定时销毁,避免信息的泄露。

GitHub 开源项目 robherley/snips.sh,该项目在 GitHub 有超过 774 Star,用一句话介绍该项目就是:“passwordless, anonymous SSH-powered...

阅读更多

TypeID - 一个受 Stripe IDs 启发的类型安全、K-可排序、全局唯一标识符生成工具

在进行大型项目开发时,我们经常会遇到需要对各种类型的数据进行唯一标识的问题。传统的 UUIDv4 虽然可以提供全局唯一的标识,但是它完全随机的特性使得在数据库中的排序性能较差,且无法直观地理解其代表的实体类型。这就需要我们寻找一个既能提供全局唯一标识,又具有良好的排序性能和类型安全性的解决方案。

GitHub 开源项目 jetpack-io/typeid,该项目在 GitHub 有超过 2.3k Star,用一句话介绍该项目就是:“Type-safe,...

阅读更多

Suo5 - 一款高性能 HTTP 代理隧道工具

在我们的日常工作中,经常会遇到需要使用 HTTP 代理隧道的情况,比如在进行网络安全研究、进行网络调试、访问特定网络资源等等。然而,传统的隧道工具如 Neo-reGeorg 等,性能往往无法满足我们的需求,而且对于 Nginx 反向代理和负载均衡场景的支持也不够完善。这时候,我们就需要一个性能更高、功能更强大的 HTTP 代理隧道工具。

...

阅读更多

OpenMeter - 一个实时、可扩展的云产品使用计量解决方案

在人工智能、DevOps、计费和分析等领域,我们经常会遇到需要精确和实时的使用计量的问题。这个问题的核心痛点在于,传统的计量方式往往无法满足实时性和精确性的双重需求,而且难以适应大规模和复杂的使用场景。

GitHub 开源项目 openmeterio/openmeter,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“Accurate and real-time...

阅读更多

FlyDB - 一款平衡性能和存储成本键值(KV)存储引擎

在当今的数据驱动时代,我们经常会遇到需要快速、高效地存储和检索键值对数据的需求。然而,许多现有的存储解决方案,如 Redis,虽然在性能上表现出色,但在存储成本上可能较高。这就需要我们寻找一种能够平衡性能和存储成本的解决方案。

GitHub 开源项目 ByteStorage/FlyDB,该项目在 GitHub 有差不多 1000 Star,用一句话介绍该项目就是:“The high-performance...

阅读更多

Rig.dev - 一个专为 Kubernetes 设计的开发者中心化应用平台

在现代的开发环境中,Kubernetes 已经成为了云原生应用的首选平台。然而,对于开发者来说,Kubernetes 的复杂性却是一大挑战。如何简化应用的部署、管理、调试和扩展,如何提供用户管理、认证、存储和数据库集成等基础 API,这些都是开发者在使用 Kubernetes 时常常会遇到的问题。

GitHub 开源项目 rigdev/rig,该项目在 GitHub...

阅读更多

Weaver - 一款简化分布式应用编写、部署和管理的编程框架

在云计算和分布式技术日益发展的今天,我们经常会遇到编写、部署和管理分布式应用的需求。然而,这个过程可能会遇到各种问题,比如环境配置复杂、部署步骤繁琐、本地和云端环境一致性难以保证等。这些问题不仅消耗了大量的开发时间,也增加了项目的复杂性。

GitHub 开源项目 ServiceWeaver/weaver,该项目在 GitHub 有超过 3.8k Star,用一句话介绍该项目就是:“Programming framework for...

阅读更多

DevOps 学习笔记及参考手册

在当今快速发展的互联网时代,DevOps(开发与运维)的理念越来越受到企业的重视。DevOps 不仅能够提高软件开发和交付的效率,还能够帮助企业更好地应对市场变化,提高竞争力。然而,DevOps 涉及的工具和技术非常多,包括 Kubernetes、Docker、GitHub Actions、Linux、Git、网络、YAML、Go、Helm、Prometheus、GitOps、ArgoCD、Portainer、Jenkins、Bash Scripting、Lens IDE、Kubescape、ValidKube 等,对于开发人员来说,如何快速有效地学习和掌握这些工具和技术,是一个非常大的挑战。

GitHub 开源项目...

阅读更多

Bearer - 一个静态应用安全测试(SAST)工具

在当今的互联网时代,数据安全和隐私保护的重要性不言而喻。然而,随着开发语言和框架的多样化,开发者在编写代码时可能会无意中引入安全风险和隐私泄露的问题,如路径遍历、开放重定向、敏感信息暴露、SQL 注入、输入验证、XSS、XPath 等问题。这些问题可能会导致严重的数据泄露和系统安全风险。

GitHub 开源项目 Bearer/bearer,该项目在 GitHub 有超过 1.3k Star,用一句话介绍该项目就是:“Code...

阅读更多

Nunu - 一个用于构建 Go 应用程序的脚手架工具

在我们日常的开发工作中,构建 Go 应用程序可能会遇到一些问题,比如如何有效地组织代码,如何选择合适的库,如何保证应用的性能和安全性等。这些问题需要我们花费大量的时间和精力去解决。

GitHub 开源项目 go-nunu/nunu,该项目在...

阅读更多

Incus - 一个现代化、安全且强大的 Linux 系统容器和虚拟机管理器

在现代的 IT 环境中,我们经常会遇到需要管理和运行全套 Linux 系统(比如官方和社区版本的 Ubuntu 镜像)的问题,这包括在容器或虚拟机中运行。同时,我们也需要一个能够在单机到数据中心集群之间进行扩展的解决方案,以便在开发和生产环境中运行工作负载。

GitHub 开源项目 lxc/incus,该项目在...

阅读更多

Pop - 一个可以在命令行终端下发送邮件的开源项目

在日常工作中,我们经常需要发送电子邮件,但是有时候在命令行终端环境下,我们需要通过命令行来发送邮件,这时候就需要一个能够在终端下发送邮件的工具。然而,市面上的这类工具往往操作复杂,使用不便。

GitHub 开源项目 charmbracelet/pop,该项目在 GitHub 有超过 1.7k Star,用一句话介绍该项目就是:“Send emails from...

阅读更多

gron - 使 JSON 数据可以使用 grep 命令进行搜索

在我们日常的开发工作中,经常会遇到需要处理 JSON 数据的情况。JSON 数据的优点是结构清晰,易于理解,但是当我们需要在大量的 JSON 数据中寻找特定的信息时,就会感到非常困扰。传统的 grep 命令虽然可以在文本中搜索特定的字符串,但是对于 JSON 数据的搜索并不友好。这就是我们需要 “...

阅读更多

SQLedge - 一个可以在边缘设备上运行的数据同步解决方案

在现代的数据驱动的世界中,我们经常会遇到需要在不同的数据库之间复制和同步数据的需求。特别是在边缘计算的场景下,我们需要将数据从中心数据库(如 Postgres)复制到边缘设备上的轻量级数据库(如 SQLite)。然而,这种数据同步的过程可能会遇到各种问题,比如数据一致性问题、网络延迟问题、数据转换问题等。

GitHub 开源项目 zknill/sqledge,该项目在 GitHub 有超过 896 Star,用一句话介绍该项目就是:“Replicate...

阅读更多

OpenTF - Terraform 的真正开源版本

在云计算日益普及的今天,我们会遇到如何有效管理云基础设施的问题。这个问题可能涉及到如何实现基础设施的版本控制,如何并行创建和修改非依赖资源,以及如何自动化复杂的变更等。这些都是我们在云基础设施管理中的核心痛点。

GitHub 开源项目 opentffoundation/opentf,该项目在 GitHub 有超过 4.5k Star,用一句话介绍该项目就是:“OpenTF lets you...

阅读更多

CloudFox - 帮助渗透测试人员找到云基础设施中安全问题

随着云计算的普及,云环境的安全问题日益突出。在云环境中,我们可能会遇到各种安全问题,例如:AWS 账户使用的区域以及账户中的资源数量,EC2 用户数据或特定服务环境变量中隐藏的秘密,具有管理员权限的工作负载,以及可能存在的攻击路径等。这些问题的解决需要我们对云环境有深入的了解,但对于不熟悉的云环境,我们往往难以快速掌握其情况,这对大多数云用户来说都是需要解决的核心痛点。

GitHub 开源项目 BishopFox/cloudfox,该项目在 GitHub 有超过 1.5k Star,用一句话介绍该项目就是:“Automating...

阅读更多

Terraform - 一个用于安全、高效地构建、更改和版本控制基础设施的工具

在日常的 IT 运维工作中,我们经常会遇到需要频繁创建、更改和优化基础设施的问题。这个过程中,我们需要处理大量的 API,编写复杂的配置文件,而且这些工作往往需要团队成员之间进行共享和协作。这个过程中的任何一个环节出现错误,都可能导致整个基础设施的运行出现问题。这是一个非常核心,日常经常碰到的痛点。

GitHub 开源项目 hashicorp/terraform,该项目在 GitHub 有超过 38.7k...

阅读更多

Layerform - 基于 Terraform 帮助工程师创建可复用的环境堆栈

在日常的软件开发过程中,我们常常会遇到环境配置的问题。每当我们需要创建一个新的环境,比如一个 staging 环境,我们往往需要从头开始配置,这不仅耗时耗力,而且可能会因为配置的细微差异导致环境不一致的问题。这就是我们需要解决的核心痛点。

GitHub 开源项目 ergomake/layerform,该项目在 GitHub 有超过 891 Star,用一句话介绍该项目就是:“Layerform...

阅读更多

Nightingale - 可替代 Grafana/Prometheus 的企业级云原生可观察性解决方案

在企业级的云原生环境中,我们常常会遇到一些监控问题。例如,我们可能需要使用 Prometheus 进行告警,使用 Grafana 进行可视化,但是这些系统往往是分散的,缺乏一个统一的视图,无法开箱即用。此外,通过修改配置文件来管理 Prometheus 和 Alertmanager 的方式学习曲线较大,难以进行协作。再者,如果数据量过大,可能会面临 Prometheus 集群扩展的问题。这些都是我们在实际应用中可能会遇到的问题。

...

阅读更多

fp-go - 专为 Go 语言设计的函数式编程库

在编程领域中,函数式编程是一种编程范式,它将计算视为函数的评估,避免改变状态和可变数据。然而,Go 语言并没有内建对函数式编程的支持,这使得在 Go 语言中实现函数式编程变得困难。

GitHub 开源项目 IBM/fp-go,该项目在 GitHub 有超过 1.1k...

阅读更多

Terminal GPT - 一个跨平台的命令行界面聊天工具

在日常编程开发过程中,我们经常需要使用智能聊天机器人进行对话,已经有点离不开智能 AI 工具了,但是往往需要 API 密钥才能使用,这对很多用户来说是一个难题。此外,我们也希望能够在终端环境中直接使用聊天机器人,而不需要通过复杂的界面操作。

GitHub 开源项目 aandrew-me/tgpt,该项目在 GitHub 接近...

阅读更多

WuKongIM - 一款经过 8 年积累沉淀出来的高性能通用实时通讯服务

在当今信息爆炸的时代,实时通讯服务的需求日益增长。无论是即时通讯(聊天软件)、消息推送、音视频信令、直播弹幕、客服系统,还是 AI 通讯等场景,都离不开高效、稳定、安全的通讯服务支持。然而,市面上的通讯服务产品或多或少存在一些问题,如性能瓶颈、依赖复杂、安全性不足等,这给开发者带来了很大的困扰。

GitHub 开源项目 WuKongIM/WuKongIM,该项目在 GitHub 有接近 1k Star,用一句话介绍该项目就是:“8年积累,沉淀出来的高性能通用实时通讯服务,支持即时通讯(聊天软件)(IM)(Chat),消息推送,消息中台,音视频信令,直播弹幕,客服系统,AI通讯,即时社区等场景”。

...

阅读更多

HackBrowserData - 一款可全平台运行的浏览器数据导出解密工具

在日常的网络生活中,我们会使用各种浏览器来访问互联网,浏览器中会存储大量的个人数据,如密码、历史记录、书签、cookies 等。然而,这些数据往往被加密存储,当我们需要迁移数据或进行数据备份时,就会遇到困扰。此外,对于网络安全研究人员来说,如何解密并导出浏览器数据也是一项重要的研究内容。

GitHub 开源项目 moonD4rk/HackBrowserData,该项目在 GitHub 有超过 8.4k Star,用一句话介绍该项目就是:“Decrypt passwords/cookies/history/bookmarks...

阅读更多

一个逆向工程的 Obsidian 同步和发布服务器

在我们日常的学习、工作中,经常会使用 Obsidian 这款知识管理工具来记录和整理信息,但是 Obsidian 的同步和发布服务并不是开源的,这就给我们带来了一些问题,比如我们无法自定义同步服务,无法在不同设备间实现实时同步,也无法进行文件历史记录的恢复和快照的获取。这些问题都需要我们去寻找一个解决方案。

GitHub 开源项目 acheong08/rev-obsidian-sync,该项目在 GitHub 有超过...

阅读更多

Ollama - 本地运行、创建和共享大型语言模型

在当前的人工智能领域,大型语言模型(LLMs)的应用越来越广泛,但是对于许多开发者来说,如何在本地快速运行和创建大型语言模型仍然是一个挑战。这主要是因为大型语言模型通常需要大量的计算资源和专业的技术知识。此外,如何共享和管理这些模型也是一个问题。因此,我们需要一个工具来帮助我们解决这些问题。

GitHub 开源项目 jmorganca/ollama,该项目在 GitHub 有超过 6.6k Star,用一句话介绍该项目就是:“Get up and...

阅读更多

微信聊天记录持久化备份本地硬盘,释放手机存储空间

在日常生活中,我们经常使用微信进行各种沟通交流,而这些聊天记录中可能包含了许多重要的信息。然而,随着聊天记录的增多,手机的存储空间会被大量占用,而且微信自身并没有提供很好的聊天记录备份和查看功能,这就导致了我们无法有效地管理和查看这些聊天记录。这是一个让人头疼的问题,但是现在有了一个开源项目 wechat-backup,它可以帮助我们解决这个问题。

wechat-backup 项目在 GitHub 有超过 2.3k Star,用一句话介绍该项目就是:“微信聊天记录持久化备份本地硬盘,释放手机存储空间。”。

阅读更多

CasaOS - 一个简单、易用、优雅的开源个人云系统

在日益发展的云计算时代,我们发现了三个重要的趋势:计算能力和存储成本的快速降低,云计算的一部分正在向边缘计算转移,以及消费者数据资产所有权和归属问题被忽视。基于这些趋势,我们提出了一个思考实验:如果在未来五年内,个人云服务能够以不到 100 块的价格提供,那将会是怎样的一种情况?这个个人云服务将为创作者和小型组织提供一个低成本的数据协作解决方案,作为个人数据中心,存储和管理数据。

今天要给大家推荐 CasaOS 项目在 GitHub 有超过 12.9k Star,用一句话介绍该项目就是:“CasaOS -...

阅读更多

ntfy - 一个基于 HTTP 的简单发布订阅通知服务

在我们的日常编程工作中,经常会遇到需要及时获取信息的情况,比如需要追踪某个任务的完成情况,或者需要及时获取某个事件的通知。然而,传统的通知方式往往需要我们去主动查询,或者需要通过电子邮件、短信等方式接收,这些方式不仅效率低下,而且可能会被各种信息淹没。这个时候,我们就需要一个能够主动推送通知到我们手机或者桌面的服务。

GitHub 开源项目 binwiederhier/ntfy,该项目在 GitHub 有超过 12.0k Star,用一句话介绍该项目就是:“Send push notifications...

阅读更多

开源免费的个人记账解决方案

在日常生活中,我们经常需要进行个人记账,但是市面上的记账软件要么需要付费,要么广告过多,要么功能不够完善。而开源免费的个人记账解决方案——九快记账,可以完美地解决这些问题。

该项目在 GitHub 有超过 500 Star,用一句话介绍该项目就是:“开源免费的个人记账解决方案”。

阅读更多

LangChain 的 Go 语言实现

LangChain 是大模型应用的明星项目,但是其使用的是 Python 进行开发的,可能很多的公司并不是正在使用 Python,这样就很难融入到已有的基础设施之上,比如现在有不少公司使用 Go 语言开发,那如果也要使用 LangChain 这样的项目,应该怎么办?

GitHub 开源项目 tmc/langchaingo,该项目在...

阅读更多

PeerDB - 一个专为 Postgres 设计的数据迁移平台

在数据处理过程中,我们经常需要将数据从一个数据库迁移到另一个数据库。然而,这个过程通常非常耗时,特别是当数据量很大时。此外,现有的数据工具通常忽略了 Postgres 用户的需求,这使得 Postgres 用户需要自己构建定制的管道来满足自己的需求。因此,我们需要一个专门为 Postgres 用户提供简单可靠的数据迁移解决方案的开源项目。

PeerDB 项目在 GitHub 差不多...

阅读更多

Capslock - Google 开源 Go 语言软件供应链安全评估工具

在开源软件供应链攻击日益增多的背景下,第三方依赖包的安全性备受关注。Capslock 是一个针对 Go 语言包的能力分析命令行工具,通过跟踪调用特权标准库操作来分类 Go 包的能力,告知用户给定包可以访问哪些特权操作。通过 Capslock,用户可以更全面地了解依赖包的权限,从而更好地进行安全评估。

...

阅读更多

GodMode - 一个专门为智能聊天机器人设计的浏览器

在日常使用中,我们经常需要使用多个智能聊天机器人,但是每次都需要打开多个网页或者应用程序,非常麻烦。而且,有些聊天机器人的功能还没有提供 API,无法通过程序调用。这些问题都可以通过使用 GodMode 来解决。

GodMode 项目在 GitHub 有超过 2.2k Star,用一句话介绍该项目就是:“AI Chat...

阅读更多

New-Grad-2024 - 为即将毕业的学生提供便捷寻找工作的平台

对于即将毕业的学生来说,找到一份满意的工作是一个非常重要的问题。然而,对于新人来说,找到一份合适的工作并不容易,需要花费大量的时间和精力去寻找和筛选。而且,由于信息不对称,很多好的工作机会可能被忽略掉。因此,有一个集中展示全职工作机会的平台是非常有必要的。

GitHub 开源项目 ReaVNaiL/New-Grad-2024,该项目在 GitHub 有超过 3.6k Star,用一句话介绍该项目就是:“We’ve put together...

阅读更多

一个轻量级、高性能、嵌入式的规则引擎

在处理大量数据时,我们经常需要对数据进行聚合、分发、过滤、转换、丰富和执行各种操作。而 RuleGo 是一个基于 Go 语言的轻量级、高性能、嵌入式规则引擎,可以帮助我们解决这些问题。它可以在低成本设备上高效地处理和链接数据,适用于物联网边缘计算。同时,RuleGo 还是一个灵活、高度可定制的事件处理框架,可以满足高度个性化或频繁变化的业务场景需求。

用一句话介绍...

阅读更多

k8sgpt - Kubernetes 集群智能扫描和诊断工具

在 Kubernetes 集群中,由于集群规模庞大,存在大量的资源和配置,因此很容易出现问题。而解决这些问题需要具备专业的知识和经验,对于普通用户来说是一项挑战。k8sgpt 项目的出现就是为了解决这个问题,它是一个基于自然语言处理和人工智能技术的 Kubernetes 集群扫描和诊断工具,能够以简单易懂的方式诊断和解决 Kubernetes 集群中的问题。

k8sgpt 项目在 GitHub...

阅读更多

Walk - 一个简单好用的终端文件管理器

在终端中进行文件管理时,我们通常需要频繁使用 cd 和 ls 命令来进行文件夹的切换和查看,但是这种方式不够直观,也不够快捷。因此,对于一个命令行工具的爱好者来说,需要一个更加简单和极简的终端文件管理器来帮助我们更快速地进行文件管理。

GitHub 开源项目 antonmedv/walk,该项目在 GitHub 有超过...

阅读更多

prettymapp - 一个创建个性化地图展示的工具

在我们的日常生活中,我们经常需要查看地图来获取位置信息或者规划路线。然而,传统的地图界面可能显得单调乏味,难以满足用户的审美需求。此时,prettymapp 这个开源项目就能派上用场了。

prettymapp 项目在 GitHub 有超过 1.2k Star,用一句话介绍该项目就是:“Create beautiful maps from...

阅读更多

Quai Network - Go 官方实现推荐

在区块链技术的发展中,去中心化网络的概念越来越受到重视。然而,现有的去中心化网络面临着许多问题,如性能瓶颈、安全性等。为了解决这些问题,Quai Network 应运而生。然而,由于Quai Network是一个新兴的项目,因此需要一个高效的实现来推动其发展。这就是 Go Quai 项目的目的所在。

Go Quai 项目在 GitHub...

阅读更多

PMail - 一种快速、简单、安全搭建私人邮件服务器的解决方案

在现代社会,电子邮件已经成为人们日常生活和工作中必不可少的一部分。然而,使用第三方邮件服务商的安全性和隐私性存在一定的风险。因此,许多人希望能够拥有自己的私人邮件服务器,但是搭建私人邮件服务器需要一定的技术知识和时间成本。而 PMail 项目的出现,为用户提供了一种快速、简单、安全的搭建私人邮件服务器的解决方案。

PMail 在 GitHub 有 498 Star,用一句话介绍该项目就是:“Private EMail Server”。

...

阅读更多

Zep - 一个为大模型/聊天应用程序提供长期存储的项目

在构建LLM / Chatbot应用程序时,我们需要一个长期存储的解决方案,以便存储相关文档、聊天历史记录和丰富的用户数据,以便在应用程序的提示中使用。然而,当前市场上的解决方案大多数都是基于内存的,无法满足长期存储的需求,因此Zep 项目应运而生。

Zep 在 GitHub 有 1k 左右 Star,用一句话介绍该项目就是:“Zep:...

阅读更多

OneAPI - 大模型 API Token 管理系统,支持超多模型

在使用各种大模型进行开发时,我们常常需要管理和分发各种 API key,这个过程通常比较繁琐,而且容易出现各种问题,例如 key 泄露、使用不当等。为了解决这些问题,开发者 songquanpeng 开发了一个名为 OneAPI 的开源项目,它是一个 OpenAI 接口管理...

阅读更多

TypeScript Book - 一本全面而简洁的 TypeScript 指南

在现代的软件开发中,使用 TypeScript 来构建可靠、可维护的应用程序变得越来越重要。然而,学习 TypeScript 的过程可能会变得复杂和冗长。The Concise TypeScript Book 的目标是提供一本全面而简洁的 TypeScript 指南,帮助开发者快速掌握...

阅读更多

GPT Engineer - AI 工程师大行其道,自己动手写代码

在软件开发过程中,经常需要根据需求编写代码。然而,编写代码是一个耗时且繁琐的任务。GPT Engineer 项目旨在解决这个问题,它基于用户的需求生成完整的代码库。您只需指定您想要构建的内容,AI 会向您询问细节,并最终生成相应的代码。

GitHub 开源项目 AntonOsika/gpt-engineer,该项目在 GitHub 有超过 36.4k...

阅读更多

S.A.T.U.R.D.A.Y - 构建优雅语音接口的工具箱

在现代科幻电影中,我们经常看到能够与人类进行交流的智能语音助手。然而,在现实世界中,要构建一个功能强大、自定义的语音接口是一项具有挑战性的任务。S.A.T.U.R.D.A.Y 的目标就是解决这个问题,它为您提供了构建优雅语音接口的工具,以便与现代语言模型进行交互。该项目旨在建立一个志同道合的社区,共同实现电影中承诺给我们的技术。S.A.T.U.R.D.A.Y 设计高度模块化和灵活,同时与特定的 AI 模型解耦,以便在发布新的 AI 技术时无缝升级。

GitHub 开源项目 GRVYDEV/S.A.T.U.R.D.A.Y,该项目在...

阅读更多

MetaGPT - 一个多智能体元编程框架,AI 打造的软件外包公司

在软件开发过程中,我们常常面临着复杂任务的处理和多人的协作问题。如何将不同的 GPT 模型分配给不同的角色,并形成一个协作的软件实体,成为我们需要解决的核心问题。这个问题涉及到从一个简短的需求描述中生成产品文档、架构设计、任务列表、代码等多个方面,具有较高的细节和复杂度。

GitHub 开源项目 geekan/MetaGPT,该项目在 GitHub...

阅读更多

Sourcegraph - 一个代码智能平台,帮助你高效阅读和编写代码

在处理大型、复杂的代码库时,我们常常会遇到阅读、编写和修复代码的困扰。代码的搜索和理解、查找引用、查看代码负责人、跟踪历史等操作变得十分繁琐。这些问题给开发者带来了很大的困扰,也降低了他们的效率。

GitHub 开源项目 sourcegraph/sourcegraph,该项目在 GitHub 有超过 8.5k Star,用一句话介绍该项目就是:“Code Intelligence Platform”。

...

阅读更多

GPT-Migrate - AI 帮你做项目语言迁移重构

在软件开发过程中,我们常常面临将代码库从一个框架或语言迁移到另一个框架或语言的问题。这是一个费时、繁琐且非常复杂的问题。如果你曾经面对过将代码库迁移到新的框架或语言的痛苦,那么这个项目就是为你而设计的。

GitHub 开源项目 0xpayne/gpt-migrate,该项目在 GitHub 有超过 6.2k Star,用一句话介绍该项目就是:“Easily migrate your...

阅读更多

FerretDB:一个真正的开源 MongoDB 替代品

在我们的开发过程中,我们经常遇到使用 MongoDB 的问题。MongoDB 曾经是一项令人惊叹的技术,让我们开发人员能够比使用关系型数据库更快地构建应用程序。然而,随着时间的推移,MongoDB 放弃了它的开源本质,将许可证更改为 SSPL,这使得许多开源项目和早期商业项目无法使用它。大多数 MongoDB 用户并不需要 MongoDB 提供的高级功能,但他们需要一个易于使用的开源文档数据库解决方案。为了填补这个空白,FerretDB 应运而生。

...

阅读更多

DataEase - 人人可用的开源数据可视化分析工具

在处理海量数据并进行深入分析时,我们常常面临一系列挑战。数据的可视化呈现和图表制作需要大量的工作量和时间投入,而且对于不熟悉编程的用户来说,使用复杂的数据处理工具也存在一定的困难。此外,数据源的连接、数据引擎的选择以及多种数据格式的支持也是我们在数据分析过程中需要面对的问题。

GitHub 开源项目 dataease/dataease,该项目在 GitHub 有超过 12.5k Star,用一句话介绍该项目就是:“人人可用的开源数据可视化分析工具。”。

阅读更多

BlockSuite - 一款开源专注团队协作的编辑器

在构建协作编辑器项目时,我们经常面临许多问题,例如如何实现实时协作、如何设计一个灵活可扩展的编辑器框架、如何处理复杂的富文本内容等。BlockSuite是一个开源项目,旨在解决这些问题并提供一个功能强大且易于使用的协作编辑器解决方案。

GitHub 开源项目 toeverything/blocksuite,该项目在 GitHub 有超过 2.0k Star,用一句话介绍该项目就是:“🍬 BlockSuite is...

阅读更多

langchain-ChatGLM - 基于本地知识库的 ChatGLM 问答

在开发过程中,我们经常会遇到需要构建基于本地知识库的问答系统的问题。这种系统需要能够根据用户提供的问题,在本地的知识库中查找并返回相关答案。然而,要实现这样的功能并不容易,涉及到语言模型的选择、知识库的管理以及问答的匹配和检索等核心问题。

GitHub 开源项目 imClumsyPanda/langchain-ChatGLM,该项目在 GitHub 有超过 13.5k Star,用一句话介绍该项目就是:“langchain-ChatGLM, local knowledge...

阅读更多

DevPod - 为你提供可定制的开发环境

在开发过程中,我们经常会面临创建和管理可复现的开发环境的挑战。无论是在本地机器、Kubernetes 集群、远程服务器还是云上的虚拟机中,为了满足项目的需求,我们需要构建适合的开发环境。然而,这样的环境配置往往复杂,而且不同的后端环境需要不同的配置方式。为了解决这个问题,我们希望有一个开源的工具,能够根据统一的配置文件,在任何后端环境中创建可复现的开发环境。

GitHub 开源项目 loft-sh/devpod,该项目在 GitHub 有超过 2.6k Star,用一句话介绍该项目就是:“Codespaces but...

阅读更多

milvus - 下一代 AI 应用存储系统,云原生向量数据库

ChatGPT 再一次引爆人工智能,而对于人工智能处理的非结构数据来说,能够将非结构的数据进行向量化的存储,有利于后续的 AI 算法的使用。

用专业一点术语就是,在处理嵌入式相似性搜索和人工智能应用时,我们常常遇到一些问题。首先,对于非结构化数据的搜索并不容易,而且在不同的部署环境下使用体验也不一致。其次,存储和计算之间的耦合限制了系统的弹性和灵活性。针对这些问题,我们推荐一个解决方案:Milvus。

Milvus 项目在 GitHub 有超过 20.6k Star,用一句话介绍该项目就是:“A...

阅读更多

一键拥有你自己的跨平台 ChatGPT 应用

在我们日常的工作和生活中,已经慢慢的离不开 ChatGPT 了,什么都可以问问它,但是目前 ChatGPT 在跨多端的使用上还是不是很便利的,对于普通用户来说,在任何时候、任何地点、任何设备上都能快速的访问 ChatGPT,很有必要。

GitHub 开源项目 Yidadaa/ChatGPT-Next-Web,该项目在 GitHub 有超过...

阅读更多

机器学习模型测试框架推荐

在机器学习领域,对于模型的测试是一项关键任务。由于机器学习模型依赖于数据,测试场景会受到特定领域问题的影响,往往是无限多的。那么从哪里开始测试?该实施哪些测试?应该覆盖哪些问题?如何实施这些测试?在Giskard项目中,我们相信机器学习需要自己的测试框架。Giskard 是一个专注于机器学习模型的开源测试框架,涵盖了从表格模型到语言模型(LLMs)的测试需求。

Giskard-AI/giskard 项目在 GitHub 有超过 1000 Star,用一句话介绍该项目就是:“The testing framework dedicated...

阅读更多

ChatGLM-6B:可本地部署的开源双语对话语言模型

在处理双语对话时,我们经常会遇到各种语言模型不足的问题,包括语义理解、回答准确性等。这些问题限制了对话系统的表现,给开发者带来了挑战。而如今出现的大模型在以上问题有不错的表现,但是一般大模型在部署上需要非常的资源,难以本地化的部署,而今天要推荐的开源项目 ChatGLM-6B 作为一种开源的双语对话语言模型,正是为了解决这些核心痛点而诞生的。

ChatGLM-6B 项目在 GitHub 有超过 30.4k...

阅读更多

Tier - 给你的SaaS应用添加定价的最简单方式

1.

在构建和管理SaaS应用的过程中,定价模型是一个重要的方面。然而,传统的定价方法往往复杂而繁琐,难以管理。Tier是一个解决方案,它提供了一个简单、集中的方式来定义和管理你的SaaS应用的定价模型。通过Tier,你可以轻松解决与定价相关的问题,从而将注意力集中在核心业务上。

Tier 项目在 GitHub 有 600+ Star,用一句话介绍该项目就是:“The easiest way to...

阅读更多

集购物和聊天于一体的综合电商系统

在电商领域,我们常常面临着多个系统之间的数据同步、功能复用和用户体验的难题。传统的电商系统常常分散在不同的平台上,购物和聊天功能往往需要跳转到不同的页面进行操作,给用户带来了不便。MallChat 项目的诞生旨在解决这一问题,打造一个集购物和聊天于一体的综合电商系统。

开源项目 zongzibinbin/MallChat 在 GitHub 有超过 1.7k Star,用一句话介绍该项目就是:“mallchat的后端项目,是一个既能购物又能聊天的电商系统。以互联网企业级开发规范的要求来实现它,电商该有的购物车,订单,支付,推荐,搜索,拉新,促活,推送,物流,客服,它都必须有。”。

阅读更多

OpenObserve - 一个云原生的观测性平台,Elasticsearch/Splunk/Datadog 的替代产品

在日志、指标、跟踪和分析领域,我们面临着许多问题,其中核心痛点包括难以操作、高存储成本和低性能。为了解决这些问题,今天要介绍一个名为 OpenObserve 的开源项目。OpenObserve 是一个云原生的观测性平台,专为处理 PB 字节级规模的日志、指标、跟踪和分析而设计。它不仅易于操作,而且能够极大地降低存储成本、提升性能。

openobserve 项目在 GitHub 有超过 3.9k...

阅读更多

一个基于 OpenFlamingo 的多模态模型

在我们日常生活中,存在许多需要指令跟随和上下文学习的场景。然而,传统的模型往往难以同时处理多模态输入和进行准确的指令理解。这导致了问题的难解性和效果的不佳。为了解决这些问题,项目 Otter 应运而生。

Otter 是一个基于 OpenFlamingo(DeepMind 的 Flamingo 开源版本)的多模态模型,它在 MIMIC-IT 数据集上进行训练,展示了改进的指令跟随和上下文学习能力。

阅读更多

ChatGPT 与命令行的完美结合,极大提升开发效率

在日常开发中,我们经常会遇到需要查找代码、改进代码库以及对代码进行评审的情况。同时,我们也需要进行代码重构、生成测试代码、执行Shell命令等任务。这些操作往往需要借助浏览器查找相关的信息,存在多个软件的切换,可能会花费大量的时间和精力,降低开发效率。为了解决这些问题,今天要介绍一个多功能命令行工具:auto-copilot-cli。

项目介绍

auto-copilot-cli 是一个功能丰富的工具,提供了多项功能,包括:

  • AI代码交互:帮助您快速查找和改进代码库,并回答与代码相关的问题。
  • 代码评审:提供代码评审功能,帮助您发现潜在的问题并提出改进建议。
  • 提交前代码检查:生成提交消息的预提交钩子,提供代码质量保证。
  • 代码重构和代码风格检查:支持对文件夹或文件的代码重构和代码风格检查。
  • 测试代码生成:自动生成测试代码,提高测试覆盖率。
  • Shell命令生成与执行:自动生成Shell命令并执行。
  • 自然语言转SQL:将自然语言转换为SQL查询语句。
  • ...

阅读更多

潘多拉,一个让你更顺畅使用 ChatGPT 的工具

在日常使用 ChatGPT 过程中,你是不是碰到了如下众多的问题,比如网络限制、账号被限制、官方限流等。为了避免以下问题,今天要推荐一个工具,能够帮助你更好的使用 ChatGPT。以下是具体问题介绍,看看你有没有碰到过:

1、动不动来一下,有时候还不动或者出人机验证。痛!

2、经典问题,只能到处找可用VPN,费时费力,更费钱。移动端访问更难。痛!

阅读更多

JunoDB - PayPal 自研的安全高可用 KV 数据库

在处理大规模数据和高并发负载时,安全、一致性和高可用性是关键问题。由此引发了我们在这个项目中所面临的挑战。我们需要一个自主开发的安全、一致性和高可用性的键值存储系统,能够在任何规模下提供低延迟(单位为毫秒级)的性能。

项目介绍

JunoDB 是 PayPal 自主开发的一款安全、一致性和高可用性的键值存储系统。它专注于解决大规模数据处理和高并发负载下的关键问题。JunoDB 提供了低延迟的性能,能够以毫秒级的响应时间处理各种规模的数据。

该项目具有以下主要特点:

  • ...

阅读更多

MidJourney-proxy:代理 MJ 的 discord 频道,实现 API 形式调用 AI 绘图

在日常开发中,我们经常需要使用 MidJourney 的 discord 频道来调用 AI 进行绘图,但使用过程中可能会遇到一些问题。例如,操作复杂、图像处理功能不完善等。这些问题限制了我们在AI绘图方面的效率和体验。

项目介绍

为了解决这些问题,今天要介绍一个开源项目 midjourney-proxy。该项目旨在提供一个API形式调用AI绘图的代理,使得使用MidJourney的discord频道更加便捷高效。该项目在...

阅读更多

OpenChat:快速开发大模型聊天机器人

随着人工智能的发展,安装和使用大型语言模型变得越来越复杂。OpenChat 的目标是解决这一挑战,通过提供一个两步设置过程来创建一个全面的聊天机器人控制台,简化用户与大型语言模型的交互。

OpenChat 提供了一个中心化的管理平台,用于管理多个定制化的聊天机器人,帮助用户轻松应对各种应用场景。

项目介绍

OpenChat...

阅读更多

privateGPT - 无数据泄露安全的使用 GPT 与私有文档交互

在处理敏感文档时,我们常常担心数据的安全性和隐私泄露的风险。privateGPT 正是为了解决这个问题而诞生的。它提供了一种在不连接互联网的情况下与文档进行交互的方式,确保用户的数据完全私密。

privateGPT 的设计旨在全面考虑细节和核心痛点。它提供了一个安全的执行环境,让用户可以在不担心数据泄露的情况下与文档进行交互。

privateGPT 在 GitHub 有超过 29.2k Star,用一句话介绍该项目就是:“Interact privately...

阅读更多

1Panel - 现代化、开源的 Linux 服务器运维管理面板

在现代化的技术环境中,Linux 服务器的运维管理是一个重要的课题。运维人员需要面对各种复杂的任务,包括建立和配置服务器、监控主机、管理文件和数据库等等。这些任务繁琐而耗时,给运维工作带来了很大的挑战。

GitHub 开源项目 1Panel-dev/1Panel,该项目在 GitHub 有超过 5.1k Star,用一句话介绍该项目就是:“🔥 🔥...

阅读更多

智能的通用数据库SQL客户端和报表工具

在处理数据库时,我们常常面临着复杂的SQL语句编写和繁琐的报表生成工作。这些任务不仅需要熟悉数据库操作,还需要花费大量时间和精力来完成。针对这个问题,阿里巴巴开源了一个项目——Chat2DB,它是一款智能、多功能的通用SQL客户端和报表工具,集成了ChatGPT的能力,为数据库操作带来全新的体验。

GitHub 开源项目 alibaba/Chat2DB 在 GitHub 有超过 2.4k Star,用一句话介绍该项目就是:“🔥 🔥 🔥...

阅读更多

简单易用的一键换脸工具

在现代技术的发展中,深度伪造技术逐渐引起人们的关注。然而,要创建一个深度伪造视频通常需要庞大的数据集和复杂的训练过程,对于普通用户来说具有一定的技术门槛。针对这个问题,项目 roop 提供了一种一键深度伪造(换脸)的解决方案,使用户可以通过一张目标脸的图像,快速替换视频中的脸部,无需数据集和训练。

GitHub 开源项目 s0md3v/roop,该项目在 GitHub 有超过 9.7k Star,用一句话介绍该项目就是:“one-click deepfake...

阅读更多

微软 AI 课程助力初学者上手人工智能

随着人工智能技术的快速发展,许多人对于如何入门人工智能感到困惑。针对这个问题,微软推出了开源项目 AI-For-Beginners,提供一个为期12周、共24课的人工智能课程,旨在让所有人都能轻松学习人工智能知识!

GitHub 开源项目 microsoft/AI-For-Beginners,该项目在 GitHub 有超过 8.1k Star,用一句话介绍该项目就是:“12 Weeks, 24...

阅读更多

一个现代化的 Ansible 用户界面

在处理 Ansible 相关项目时,我们经常面临繁琐的命令行操作,这对于不熟悉命令行的用户来说可能是一个挑战。此外,当项目规模扩大时,跟踪和管理多个 playbook 变得困难,同时缺乏对失败的及时通知和访问控制。这些问题催生了 Ansible Semaphore。

Ansible Semaphore 旨在解决这些问题。它提供了一个现代化的用户界面,通过直观的操作和可视化工具,使得运行 Ansible...

阅读更多

LangChain 通过组合性构建基于大模型的应用程序

在构建应用程序时,我们经常面临使用强大的语言模型所带来的挑战。然而,仅仅使用单一的语言模型往往无法创建出真正强大的应用程序,真正的威力在于能够将它们与其他计算或知识来源相结合。LangChain 的目标就是解决这个问题。

该项目在 GitHub 有超过 46.3k Star,用一句话介绍该项目就是:“⚡ Building applications with LLMs through...

阅读更多

Autocomplete:快速且功能丰富的自动完成库

在构建应用程序时,我们经常遇到需要实现自动完成功能的需求。然而,手动实现自动完成功能往往非常繁琐,需要处理输入、数据源和交互等多个方面的逻辑。Autocomplete 项目的目标正是为了解决这个问题,提供一个快速且功能丰富的自动完成库,让开发者能够轻松地构建出优秀的自动完成体验。

项目介绍

Autocomplete 提供了一种简单的方式来创建自动完成体验,在 GitHub 有超过 3.4k...

阅读更多

LocalAI 自托管、社区驱动的本地 OpenAI API 兼容替代方案

在我们的日常工作中,我们常常遇到需要使用强大的自然语言处理和生成能力的场景,然而,传统的云端 API 服务不仅价格昂贵,而且需要稳定的互联网连接。此外,运行大型语言模型通常需要昂贵的 GPU 资源。针对这些问题,今天推荐开源项目LocalAI。

LocalAI 的目标是提供一个自托管的、社区驱动的本地 OpenAI 兼容 API。我们的解决方案不仅免费开源,而且不需要 GPU,并且可以在消费级硬件上运行。我们致力于将 AI...

阅读更多

ReactPy - 用Python编写React式用户界面

在构建用户界面时,我们经常面临许多挑战。而ReactPy项目正是为了解决这些问题而诞生的。它允许我们使用Python而不是JavaScript来构建用户界面,旨在简化界面开发流程。ReactPy的目标是提供一种与ReactJS类似的组件化开发体验,使界面开发变得简单易用,同时又具备强大的扩展性。

GitHub 开源项目 reactive-python/reactpy,在 GitHub 有超过 3.9k Star,用一句话介绍该项目就是:“It’s React, but in...

阅读更多

Terramate - 增强你的 Terraform 体验

在构建和维护基础设施代码方面,开发人员常常浪费大量时间。这就是为什么我们开发了 Terramate,一个开源的代码生成器和编排工具,为 Terraform 提供强大的功能,包括代码生成、堆栈管理、编排、变更检测和数据共享等。我们解决了许多细节和核心痛点,让你的 Terraform 工作更高效、更可靠。

项目介绍

GitHub 开源项目 terramate-io/terramate,该项目在...

阅读更多

受 Google Zanzibar 启发,一个为开发人员构建的高性能、灵活的授权/权限引擎

在开发过程中,我们经常会遇到权限管理的问题。而这个问题正是 OpenFGA 项目正在解决的。OpenFGA 旨在为开发人员提供一种简单的方式来建模应用程序权限,并将细粒度的授权集成到应用程序中。它能够快速进行内存数据存储以支持快速开发,并提供可插拔的数据库模块。目前,它支持 PostgreSQL 14 和 MySQL 8 两种数据库。

该项目在...

阅读更多

最全中华古诗词数据库

在研究和学习中华古诗词时,我们常常面临着一个问题:如何获取到最全面、最可靠的古诗词数据库?这个问题正是该项目所解决的核心挑战。

GitHub 开源项目 chinese-poetry/chinese-poetry,该项目在 GitHub 有超过 41.9k Star,用一句话介绍该项目就是:“The most comprehensive database of...

阅读更多

可本地搭建的 Stable Diffusion Web 应用

在处理图像和文本时,我们经常面临着各种挑战,例如图像修复、图像上采样、文本生成等。这些问题需要强大而高效的工具来解决,Stable Diffusion 可以很好的解决以上问题,但是要想自己本地使用 Stable Diffusion,还是有一定的门槛的。Stable Diffusion Web UI 项目正是为了应对这些挑战而诞生的。

GitHub 开源项目 AUTOMATIC1111/stable-diffusion-webui,该项目在...

阅读更多

THE NEXT FUTURE,面向未来的网络通信解决方案

在现实世界的网络通信中,我们经常面临着各种问题,例如网络封锁、审查、深度包检测等。这些问题威胁着我们的隐私和自由。REALITY 项目正是为了解决这些问题而诞生的。

GitHub 开源项目 XTLS/REALITY,该项目在 GitHub 有超过 1.9k Star,用一句话介绍该项目就是:“THE NEXT FUTURE”。

阅读更多

《Hello 算法》:动画图解、可运行、可提问的数据结构与算法入门书

在学习数据结构与算法时,我们常常面临的问题是理解抽象概念、运行代码并提出问题的困难,如果算法能够进行动态的演示,并且可以很容易的执行,那对算法的学习会非常有帮助。这正是《Hello 算法》项目致力于解决的核心问题。

GitHub 开源项目 krahets/hello-algo,该项目在 GitHub 有超过 12.9k Star,用一句话介绍该项目就是:“《Hello 算法》是一本动画图解、能运行、可提问的数据结构与算法入门书,支持 Java, C++,...

阅读更多

Face Swapper:实时人脸交换的开源项目

在进行 PC 流媒体或视频通话时,我们常常希望能够进行实时的人脸交换,以增加趣味性或保护隐私。然而,要实现这一目标存在诸多挑战,如人脸检测、面部特征提取和面部重建等。这些问题正是 Face Swapper 项目正在解决的。

GitHub 开源项目 iperov/DeepFaceLive,该项目在 GitHub 有超过 13.1k...

阅读更多

Donut:文档理解变革的官方实现

在处理文档时,我们常常面临诸多挑战,例如光学字符识别(OCR)的限制、多样化文档类型和语言的复杂性。然而,这些问题正是 Donut 项目所致力解决的。

GitHub 开源项目 clovaai/donut,该项目在 GitHub 有超过 3.0k Star,用一句话介绍该项目就是:“Official Implementation of...

阅读更多

飞书 ChatGPT,飞一般的工作体验

在日常工作中,我们经常会面临与他人沟通、协作和处理信息的挑战。这些问题包括语言表达的限制、信息的碎片化以及缺乏高效的工具支持。然而,正是这些问题促使我们开发了飞书 ChatGPT。

GitHub 开源项目 Leizhenpeng/feishu-chatGpt,该项目在 GitHub 有超过 4.3k Star,用一句话介绍该项目就是:“🎒飞书 ×(GPT-4 + DALL·E...

阅读更多

Mailpit - 为开发者提供的电子邮件和SMTP测试工具

在开发过程中,我们常常会面临测试电子邮件和 SMTP 功能的需求。然而,手动测试这些功能通常很麻烦且耗时,特别是需要频繁发送和接收大量电子邮件的情况下。这正是 Mailpit 项目所解决的核心问题。

GitHub 开源项目 axllent/mailpit,该项目在 GitHub 有超过 1.1k Star,用一句话介绍该项目就是:“An...

阅读更多

懒人 Git(Lazygit)

在软件开发过程中,我们常常面临处理 Git 命令的复杂性和学习曲线陡峭的问题。针对这个问题,懒人 Git(Lazygit)项目应运而生。

懒人 Git 是一个基于终端的简单图形用户界面(TUI),专为处理 Git 命令而设计。它采用 Go 语言编写,并使用

阅读更多

解决实时流媒体服务器和代理难题的开源工具

在实时流媒体领域,我们常常面临着一个令人头疼的问题:如何方便地读取、发布和代理视频和音频流?幸运的是,我们现在有了解决这一问题的项目。

GitHub 开源项目 aler9/rtsp-simple-server,该项目在 GitHub 有超过 6.5k Star,用一句话介绍该项目就是:“Ready-to-use RTSP / RTMP /...

阅读更多

Excelize-wasm:在浏览器中操作 Excel 的工具

在Web开发中,处理Excel文件是一个常见的需求,但在Web浏览器中直接操作Excel文件是一项具有挑战性的任务。为了解决这个问题,GitHub 开源项目 xuri/excelize-wasm,用一句话介绍该项目就是:“A WebAssembly build of the Go Excelize library”。

阅读更多

再也不用为学习强国积分发愁了

GitHub 开源项目 sjkhsl/study_xxqg,study_xxqg 是一个自动化学习”学习强国”的工具(有一点绕,懂得都懂),以后再也不用为积分发愁了。该项目基于 playwright-go 开发,支持包括windows、linuxmac。并且该项目提供了针对不同的系统以及不同的启动方式,需要如下方式进行配置使用。

1、Windows

...

阅读更多