全新神经网络架构等5个火爆项目
GitHub 一周热点汇总第21期(2024/05/05-05/11) ,本周最火的项目是KAN,在其论文推出后掀起了一轮热度,让人们看到了AI能力再次提升的机会,你觉得它能取代MLP吗?先来看看这一周内火爆的5个项目吧。
GitHub 一周热点汇总第21期(2024/05/05-05/11) ,本周最火的项目是KAN,在其论文推出后掀起了一轮热度,让人们看到了AI能力再次提升的机会,你觉得它能取代MLP吗?先来看看这一周内火爆的5个项目吧。
#1 pykan
- 项目名称:pykan - KAN
- GitHub 链接:github.com/KindXiaomin…
- 上周 Star 数:7600+
本项目就是近期爆火的KAN,一个全新的神经网络架构,它的使命只有一个:取代 MLP。
KAN的名字源自 Kolmogorov-Arnold 表示定理 (KART),为了纪念两位伟大的已故数学家Andrey Kolmogorov和Vladimir Arnold,我们称其为科尔莫格罗夫-阿诺德网络(KANs)。
与传统的MLP架构截然不同,且能用更少的参数在数学、物理问题上取得更高精度。
比如,200个参数的KANs,就能复现DeepMind用30万参数的MLPs发现数学定理研究。
不仅准确性更高,并且还发现了新的公式。要知道后者可是登上Nature封面的研究啊~
在函数拟合、偏微分方程求解,甚至处理凝聚态物理方面的任务都比MLP效果要好。
而在大模型问题的解决上,KAN天然就能规避掉灾难性遗忘问题,并且注入人类的习惯偏差或领域知识非常容易。
跟MLP最大、也是最为直观的不同就是,MLP激活函数是在神经元上,而KAN把可学习的激活函数放在权重上。
对于那么KAN是否会取代Transformer中的MLP层,目前看来至少要解决2个问题:
- 学习算法,如 SGD、AdamW、Sophia 等—能否找到适合 KANs 参数的局部最小值
- 能否在GPU上高效地实现KANs层
以下是KAN的论文链接,有兴趣的话可以深入研读:
#2 fastfetch
- 项目名称:fastfetch - 系统信息
- GitHub 链接:github.com/fastfetch-c…
- 上周 Star 数:3000+
Fastfetch 是一个类似neofetch的工具,用于获取系统信息并以漂亮的方式显示它们。它主要用 C 编写,考虑到性能和可定制性。目前支持 Linux、Android、FreeBSD、MacOS 和 Windows 7+。
neofetch项目刚刚被归档了,也就是不会再持续维护了,所以作者就发布了这个项目,提供了一个性能更好的系统信息收集器,只需要几秒的时间,就能展示出全部的系统信息。项目的特点包括:
- 1.快速性能:由于主要使用 C 语言编写,Fastfetch 相较于 neofetch 更快速地获取和展示系统信息。
- 2.多平台支持:Fastfetch 在 Linux、Android、FreeBSD、macOS 和 Windows 7+ 等多种操作系统上均得到支持,提供跨平台的功能。
- 3.信息展示:Fastfetch 可以展示操作系统、Shell、内核、CPU、GPU、内存等关键信息,让用户快速了解系统环境。
- 4.可定制性:用户可以根据自己的需求定制和调整 Fastfetch 的展示信息,使其更符合个人偏好。
如果你想安装使用非常的方便,以Linux和Mac为例:
Linux
- Debian / Ubuntu: 在 Github release 页面下载fastfetch-linux-.deb 安装文件,进行安装。
- Arch Linux: 可通过 sudo pacman -S fastfetch 安装 Fastfetch。
- Fedora: 使用 sudo dnf install fastfetch 命令安装 Fastfetch。
- 其他发行版: 用户可以参考各个发行版对 Fastfetch 的支持情况,或者通过 linuxbrew 进行安装。
macOS
- HomeBrew: 通过 HomeBrew 使用 brew install fastfetch 命令进行安装。
- MacPorts: 通过 MacPorts 使用 sudo port install fastfetch 进行安装。
#3 Scrapegraph-ai
- 项目名称:Scrapegraph-ai - AI爬虫
- GitHub 链接:github.com/zyronon/dou…
- 上周 Star 数:2800 +
数据是当今世界发展的重要驱动,爬虫已成为从广阔的互联网中收集信息的重要工具。ScrapeGraphAI,这是一个革命性的 Python 库,它利用大型语言模型 (LLMs) 和直接图形逻辑的强大功能来创建灵活且适应性强的网络抓取管道。
当AI遇上爬虫,会发挥出怎样的魔力呢,目前ScrapeGraphAI具备的特性包括以下:
- 灵活性和适应性:传统的网页抓取工具通常依靠固定模式或手动配置从网页中提取数据。ScrapeGraphAI 由 LLMs提供支持,可适应网站结构的变化,从而减少对开发人员持续干预的需求。
- 易于安装:使用简单的 pip install 命令,用户可以快速设置 ScrapeGraphAI 并开始从网站、文档和 XML 文件中抓取数据。
- 多功能模型和 API:ScrapeGraphAI 支持各种模型和 API,包括 OpenAI 的 GPT、Docker、Groq、Azure 等,允许用户选择最适合其抓取需求的选项。
项目有一个在线体验的地址:scrapegraph-ai-demo.streamlit.app/
但是这里需要绑OpenAI的key,不是很推荐,还是自己部署更安心一点。
Scrapegraph-ai 的参考页面可在 pypy 的官方页面上找到:pypi。
复制代码pip install scrapegraphai
您还需要安装 Playwright 以进行基于 JavaScript 的爬取:
复制代码playwright install
注意:建议在虚拟环境中安装库,以避免与其他库的冲突
#4 GlaDOS
- 项目名称:GlaDOS - 部署 RAG 工具
- GitHub 链接:github.com/dnhkng/GlaD…
- 上周 Star 数:1600+
首先我要和你科普一下项目的名字,因为我一开始就很懵,搜了一下才明白什么是GLaDOS (Genetic Lifeform and Disk Operating System)
GLaDOS 是游戏《传送门》中的虚构角色,在该系列中被描述为一个人工超级智能 计算机系统,负责所有游戏中Aperture Science计算机辅助浓缩中心的测试和维护。虽然 GLaDOS 在第一款游戏中最初只是作为引导玩家的声音出现,但随着她明确表达自己的意图,她的言语和行为变得越来越恶意。大概就是下面这个样子。
这是一个致力于构建现实版 GLaDOS 的项目,是 Valve 在现实生活中实现 Portal 系列 AI 的第一步。
这是一个硬件和软件项目,将创建一个有意识的、交互式的、具体化的 GLaDOS。
项目最初的目标是开发一个可以在 600 毫秒内响应语音交互。为此,系统不断地将数据记录到循环缓冲区中,等待检测到语音。当确定语音已停止(包括检测到正常停顿)时,将快速转录。然后将其传递到流式本地大型语言模型,其中流式文本按句子分解,并传递到文本转语音系统。在播放当前内容时可以生成更多句子,从而大大减少延迟。
作者制定了一个后续的计划,并开始实现其中的一些步骤:
- 训练 GLaDOS 语音生成器
- 生成一个提示,导致现实的“人格核心”
- MemGPT为GLaDOS生成中长期内存
- 通过LLaVA赋予 GLaDOS 视觉
- 创建可 3D 打印的零件
- 设计动画电子系统
这东西看起来是很有意思的,如果真能搞出来,那一定非常的酷。
#5 reor
- 项目名称:reor - 本地AI知识管理
- GitHub 链接:github.com/reorproject…
- 上周 Star 数:1500+
Reor是一款基于人工智能的桌面笔记应用程序:它自动链接相关笔记、回答笔记上的问题、提供语义搜索并可以生成人工智能抽认卡。所有内容都存储在本地,您可以使用类似 Obsidian 的 Markdown 编辑器来编辑笔记。该项目的假设是,人工智能思维工具默认应该在本地运行模型。 Reor 站在Ollama、Transformers.js和LanceDB等巨头的肩膀上,使 LLM 和嵌入模型都可以在本地运行。还支持连接到 OpenAI 或 OpenAI 兼容 API(例如 Oobabooga)。
通过项目你可以做到以下的本地能力:
- 您写的每条笔记都会被分块并嵌入到内部矢量数据库中。
- 相关笔记通过向量相似度自动连接。
- LLM 支持的问答对笔记语料库进行 RAG。
- 一切都可以进行语义搜索。
将 Reor 视为一个带有两个生成器的 RAG 应用程序:LLM 和人类。在问答模式下,LLM将从语料库中获取检索到的上下文,以帮助回答查询。类似地,在编辑器模式下,人们可以切换侧边栏以显示从语料库“检索”的相关注释。这是通过将当前笔记中的想法与语料库中的相关想法交叉引用,来“增强”您的想法的一种非常有效的方法。
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
资源分享
大模型AGI学习包
资料目录
- 成长路线图&学习规划
- 配套视频教程
- 实战LLM
- 人工智能比赛资料
- AI人工智能必读书单
- 面试题合集
《人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取!
1.成长路线图&学习规划
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。
2.视频教程
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,其中一共有21个章节,每个章节都是当前板块的精华浓缩。
3.LLM
大家最喜欢也是最关心的LLM(大语言模型)
《人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取!
更多推荐
所有评论(0)