按标签浏览

LLMs

🚀微调DeepSeek-R1-Distill-Llama-8B打造SQL语言转自然语言大模型!小白也能十分钟打造自己的推理大模型!unsloth+Colab轻松上手

4 minute read

DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数语言模型,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。通过蒸馏技术,模型在保持较高性能的同时,减少了计算资源的消耗,特别适合在资源受限的环境中应用。该模型经过优化,可用于多种自然语言处理任...

🚀谷歌重磅发布Gemini 2.0 Pro!多模态能力大幅提升,训练数据质量高,编程能力强!多维度测评轻松识别手写汉字、提取模糊扫描内容,Roo Code+Gemini 2.0 Pro编程能力大幅提升

3 minute read

Gemini 2.0 Pro Experimental 是 Google 在 2025 年 2 月 5 日推出的最新实验性 AI 模型,作为 Gemini 2.0 系列的重要组成部分。该模型在编码能力、复杂提示处理及世界知识理解方面展现了当前最先进的性能,现通过 Gemini Advanced 订阅(每月 19....

🚀重磅首发!本地部署+真实测评阿里开源视觉大模型Qwen2.5-VL-7B-Instruct和Qwen2.5-VL-72B!轻松识别提取发票!全方位测评见证AI视觉理解能力的质的飞跃,图像识别不再是难题

1 minute read

2025年1月,阿里巴巴通义千问团队发布了全新的视觉语言模型——Qwen2.5-VL-7B-Instruct,作为Qwen2.5-VL系列的一员,标志着视觉语言理解领域的一次重要突破。这一中型参数模型,凭借其卓越的性能和多样化的功能,迅速吸引了业界的广泛关注。

Back to Top ↑

AI智能体

微软最强AI智能体AutoGen史诗级更新!原生支持Magentic-One和Swarm与Teams!引领AI智能体元年!支持ollama本地部署!小白也能轻松掌握AI框架保姆级教程,超详细上手指南

8 minute read

AutoGen 是一个用于构建代理 AI 应用程序的开源框架,允许开发者创建可以自主行动或与人类协作的多代理 AI 系统。AutoGen 0.4.2 是一个重要的更新版本,它在代理工作流程中提高了代码质量、稳健性、通用性和可扩展性。新的异步、事件驱动的架构使 AutoGen 更具可扩展性和稳健性,从而支持更广泛的...

告别Cursor和WindSurf!最强AI编程插件Cline3.1重磅升级:智能版本管理+任务跟踪系统,让你的代码管理更高效,一键修复Bug,从项目分析到代码优化,打造完美跨平台应用的终极指南

less than 1 minute read

最强AI编程插件Cline今天发布了最新版本Cline3.1。新增了更加智能的版本管理与任务跟踪等功能。这是的cline更加强大了!前些时间Cline 3.0版本新增了自动审批功能,而且还支持全新的差异化(diff)编辑功能,只输出需要替换的内容而不是整个文件,提高编速度和可靠性。今天Cline 3.1引入了“检...

smolagents颠覆传统AI智能体!ollama本地部署Hugging Face开源全新AI智能体!重新定义AI智能体开发!从入门到精通只需10分钟

6 minute read

HuggingFace于2024年12月31日发布了一款全新的AI代理框架SmolAgents,这是一个极简但功能强大的AI Agents库,可以让开发者用最少的代码快速构建智能代理系统。该框架的核心逻辑仅用约1000行代码就实现了完整的代理功能,极大地简化了AI代理的开发流程。

Back to Top ↑

Cline

告别Cursor和WindSurf!最强AI编程插件Cline3.1重磅升级:智能版本管理+任务跟踪系统,让你的代码管理更高效,一键修复Bug,从项目分析到代码优化,打造完美跨平台应用的终极指南

less than 1 minute read

最强AI编程插件Cline今天发布了最新版本Cline3.1。新增了更加智能的版本管理与任务跟踪等功能。这是的cline更加强大了!前些时间Cline 3.0版本新增了自动审批功能,而且还支持全新的差异化(diff)编辑功能,只输出需要替换的内容而不是整个文件,提高编速度和可靠性。今天Cline 3.1引入了“检...

Back to Top ↑

AI

🚀微调DeepSeek-R1-Distill-Llama-8B打造SQL语言转自然语言大模型!小白也能十分钟打造自己的推理大模型!unsloth+Colab轻松上手

4 minute read

DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数语言模型,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。通过蒸馏技术,模型在保持较高性能的同时,减少了计算资源的消耗,特别适合在资源受限的环境中应用。该模型经过优化,可用于多种自然语言处理任...

微软最强AI智能体AutoGen史诗级更新!原生支持Magentic-One和Swarm与Teams!引领AI智能体元年!支持ollama本地部署!小白也能轻松掌握AI框架保姆级教程,超详细上手指南

8 minute read

AutoGen 是一个用于构建代理 AI 应用程序的开源框架,允许开发者创建可以自主行动或与人类协作的多代理 AI 系统。AutoGen 0.4.2 是一个重要的更新版本,它在代理工作流程中提高了代码质量、稳健性、通用性和可扩展性。新的异步、事件驱动的架构使 AutoGen 更具可扩展性和稳健性,从而支持更广泛的...

Back to Top ↑

多模态大模型

🚀谷歌重磅发布Gemini 2.0 Pro!多模态能力大幅提升,训练数据质量高,编程能力强!多维度测评轻松识别手写汉字、提取模糊扫描内容,Roo Code+Gemini 2.0 Pro编程能力大幅提升

3 minute read

Gemini 2.0 Pro Experimental 是 Google 在 2025 年 2 月 5 日推出的最新实验性 AI 模型,作为 Gemini 2.0 系列的重要组成部分。该模型在编码能力、复杂提示处理及世界知识理解方面展现了当前最先进的性能,现通过 Gemini Advanced 订阅(每月 19....

Back to Top ↑

开源

ScrapeGraphAI开启智能数据抓取新时代!用AI重塑数据提取方式!ScrapeGraphAI+LangChain+LangGraph打造最强文章采集和写作AI智能体!让内容创作更简单

7 minute read

传统的网页抓取工具严重依赖于预定义的规则和模式,一旦目标网站的结构发生变化,就需要手动更新代码,耗时费力。而 ScrapeGraphAI 则另辟蹊径,它利用 LLMs 的强大理解能力,让用户只需用自然语言描述所需数据,剩下的复杂工作全部交给 AI 完成!

GraphRAG 1.0重磅升级!颠覆传统RAG!DRIFT搜索+Update命令!整合LM Studio本地大模型实现高效RAG!MarkItDown将PDF转为markdown!性能提升3倍

less than 1 minute read

微软于2024年12月16日正式发布了GraphRAG 1.0,这是一个将图结构数据与检索增强生成(RAG)模型相结合的开源工具,旨在提升自然语言处理任务的性能。GraphRAG 1.0的主要特点包括DRIFT搜索算法、Update命令以及与LM Studio的整合,使得用户能够更高效地处理图结构数据。此外,微软...

Back to Top ↑

自然语言处理

ScrapeGraphAI开启智能数据抓取新时代!用AI重塑数据提取方式!ScrapeGraphAI+LangChain+LangGraph打造最强文章采集和写作AI智能体!让内容创作更简单

7 minute read

传统的网页抓取工具严重依赖于预定义的规则和模式,一旦目标网站的结构发生变化,就需要手动更新代码,耗时费力。而 ScrapeGraphAI 则另辟蹊径,它利用 LLMs 的强大理解能力,让用户只需用自然语言描述所需数据,剩下的复杂工作全部交给 AI 完成!

GraphRAG 1.0重磅升级!颠覆传统RAG!DRIFT搜索+Update命令!整合LM Studio本地大模型实现高效RAG!MarkItDown将PDF转为markdown!性能提升3倍

less than 1 minute read

微软于2024年12月16日正式发布了GraphRAG 1.0,这是一个将图结构数据与检索增强生成(RAG)模型相结合的开源工具,旨在提升自然语言处理任务的性能。GraphRAG 1.0的主要特点包括DRIFT搜索算法、Update命令以及与LM Studio的整合,使得用户能够更高效地处理图结构数据。此外,微软...

Back to Top ↑

ollama

微软最强AI智能体AutoGen史诗级更新!原生支持Magentic-One和Swarm与Teams!引领AI智能体元年!支持ollama本地部署!小白也能轻松掌握AI框架保姆级教程,超详细上手指南

8 minute read

AutoGen 是一个用于构建代理 AI 应用程序的开源框架,允许开发者创建可以自主行动或与人类协作的多代理 AI 系统。AutoGen 0.4.2 是一个重要的更新版本,它在代理工作流程中提高了代码质量、稳健性、通用性和可扩展性。新的异步、事件驱动的架构使 AutoGen 更具可扩展性和稳健性,从而支持更广泛的...

smolagents颠覆传统AI智能体!ollama本地部署Hugging Face开源全新AI智能体!重新定义AI智能体开发!从入门到精通只需10分钟

6 minute read

HuggingFace于2024年12月31日发布了一款全新的AI代理框架SmolAgents,这是一个极简但功能强大的AI Agents库,可以让开发者用最少的代码快速构建智能代理系统。该框架的核心逻辑仅用约1000行代码就实现了完整的代理功能,极大地简化了AI代理的开发流程。

Back to Top ↑

vs code

告别Cursor和WindSurf!最强AI编程插件Cline3.1重磅升级:智能版本管理+任务跟踪系统,让你的代码管理更高效,一键修复Bug,从项目分析到代码优化,打造完美跨平台应用的终极指南

less than 1 minute read

最强AI编程插件Cline今天发布了最新版本Cline3.1。新增了更加智能的版本管理与任务跟踪等功能。这是的cline更加强大了!前些时间Cline 3.0版本新增了自动审批功能,而且还支持全新的差异化(diff)编辑功能,只输出需要替换的内容而不是整个文件,提高编速度和可靠性。今天Cline 3.1引入了“检...

Back to Top ↑

编程开发

告别Cursor和WindSurf!最强AI编程插件Cline3.1重磅升级:智能版本管理+任务跟踪系统,让你的代码管理更高效,一键修复Bug,从项目分析到代码优化,打造完美跨平台应用的终极指南

less than 1 minute read

最强AI编程插件Cline今天发布了最新版本Cline3.1。新增了更加智能的版本管理与任务跟踪等功能。这是的cline更加强大了!前些时间Cline 3.0版本新增了自动审批功能,而且还支持全新的差异化(diff)编辑功能,只输出需要替换的内容而不是整个文件,提高编速度和可靠性。今天Cline 3.1引入了“检...

Back to Top ↑

AI编程

告别Cursor和WindSurf!最强AI编程插件Cline3.1重磅升级:智能版本管理+任务跟踪系统,让你的代码管理更高效,一键修复Bug,从项目分析到代码优化,打造完美跨平台应用的终极指南

less than 1 minute read

最强AI编程插件Cline今天发布了最新版本Cline3.1。新增了更加智能的版本管理与任务跟踪等功能。这是的cline更加强大了!前些时间Cline 3.0版本新增了自动审批功能,而且还支持全新的差异化(diff)编辑功能,只输出需要替换的内容而不是整个文件,提高编速度和可靠性。今天Cline 3.1引入了“检...

Back to Top ↑

Fine-Tuning

🚀微调DeepSeek-R1-Distill-Llama-8B打造SQL语言转自然语言大模型!小白也能十分钟打造自己的推理大模型!unsloth+Colab轻松上手

4 minute read

DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数语言模型,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。通过蒸馏技术,模型在保持较高性能的同时,减少了计算资源的消耗,特别适合在资源受限的环境中应用。该模型经过优化,可用于多种自然语言处理任...

Back to Top ↑

微调

🚀微调DeepSeek-R1-Distill-Llama-8B打造SQL语言转自然语言大模型!小白也能十分钟打造自己的推理大模型!unsloth+Colab轻松上手

4 minute read

DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数语言模型,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。通过蒸馏技术,模型在保持较高性能的同时,减少了计算资源的消耗,特别适合在资源受限的环境中应用。该模型经过优化,可用于多种自然语言处理任...

Back to Top ↑

大模型

🚀微调DeepSeek-R1-Distill-Llama-8B打造SQL语言转自然语言大模型!小白也能十分钟打造自己的推理大模型!unsloth+Colab轻松上手

4 minute read

DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数语言模型,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。通过蒸馏技术,模型在保持较高性能的同时,减少了计算资源的消耗,特别适合在资源受限的环境中应用。该模型经过优化,可用于多种自然语言处理任...

Back to Top ↑

Text to SQL

🚀微调DeepSeek-R1-Distill-Llama-8B打造SQL语言转自然语言大模型!小白也能十分钟打造自己的推理大模型!unsloth+Colab轻松上手

4 minute read

DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数语言模型,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。通过蒸馏技术,模型在保持较高性能的同时,减少了计算资源的消耗,特别适合在资源受限的环境中应用。该模型经过优化,可用于多种自然语言处理任...

Back to Top ↑

AutoGen

微软最强AI智能体AutoGen史诗级更新!原生支持Magentic-One和Swarm与Teams!引领AI智能体元年!支持ollama本地部署!小白也能轻松掌握AI框架保姆级教程,超详细上手指南

8 minute read

AutoGen 是一个用于构建代理 AI 应用程序的开源框架,允许开发者创建可以自主行动或与人类协作的多代理 AI 系统。AutoGen 0.4.2 是一个重要的更新版本,它在代理工作流程中提高了代码质量、稳健性、通用性和可扩展性。新的异步、事件驱动的架构使 AutoGen 更具可扩展性和稳健性,从而支持更广泛的...

Back to Top ↑

deepseek

Back to Top ↑

Qwen2.5

🚀重磅首发!本地部署+真实测评阿里开源视觉大模型Qwen2.5-VL-7B-Instruct和Qwen2.5-VL-72B!轻松识别提取发票!全方位测评见证AI视觉理解能力的质的飞跃,图像识别不再是难题

1 minute read

2025年1月,阿里巴巴通义千问团队发布了全新的视觉语言模型——Qwen2.5-VL-7B-Instruct,作为Qwen2.5-VL系列的一员,标志着视觉语言理解领域的一次重要突破。这一中型参数模型,凭借其卓越的性能和多样化的功能,迅速吸引了业界的广泛关注。

Back to Top ↑

阿里巴巴

🚀重磅首发!本地部署+真实测评阿里开源视觉大模型Qwen2.5-VL-7B-Instruct和Qwen2.5-VL-72B!轻松识别提取发票!全方位测评见证AI视觉理解能力的质的飞跃,图像识别不再是难题

1 minute read

2025年1月,阿里巴巴通义千问团队发布了全新的视觉语言模型——Qwen2.5-VL-7B-Instruct,作为Qwen2.5-VL系列的一员,标志着视觉语言理解领域的一次重要突破。这一中型参数模型,凭借其卓越的性能和多样化的功能,迅速吸引了业界的广泛关注。

Back to Top ↑

Qwen2.5-VL

🚀vLLM本地部署Qwen2.5-VL多模态大模型!70亿参数即可打造监控视频目标查找项目!轻松实现监控视频自动找人!RTX A6000显卡部署Qwen2.5-VL-7B-Instruct模型实战教程

7 minute read

Qwen2.5-VL是阿里云开发的最新多模态大型语言模型,它在视觉理解、文档处理和多模态交互方面表现出色。在视觉理解方面,Qwen2.5-VL能够准确识别图像和视频中的物体、场景和关系,并进行描述。在文档处理方面,它擅长提取和分析各种类型的文档信息,包括文字、表格和图片。Qwen2.5-VL还支持自然的多模态交互...

🚀重磅首发!本地部署+真实测评阿里开源视觉大模型Qwen2.5-VL-7B-Instruct和Qwen2.5-VL-72B!轻松识别提取发票!全方位测评见证AI视觉理解能力的质的飞跃,图像识别不再是难题

1 minute read

2025年1月,阿里巴巴通义千问团队发布了全新的视觉语言模型——Qwen2.5-VL-7B-Instruct,作为Qwen2.5-VL系列的一员,标志着视觉语言理解领域的一次重要突破。这一中型参数模型,凭借其卓越的性能和多样化的功能,迅速吸引了业界的广泛关注。

Back to Top ↑

Qwen2.5-VL-7B-Instruct

🚀vLLM本地部署Qwen2.5-VL多模态大模型!70亿参数即可打造监控视频目标查找项目!轻松实现监控视频自动找人!RTX A6000显卡部署Qwen2.5-VL-7B-Instruct模型实战教程

7 minute read

Qwen2.5-VL是阿里云开发的最新多模态大型语言模型,它在视觉理解、文档处理和多模态交互方面表现出色。在视觉理解方面,Qwen2.5-VL能够准确识别图像和视频中的物体、场景和关系,并进行描述。在文档处理方面,它擅长提取和分析各种类型的文档信息,包括文字、表格和图片。Qwen2.5-VL还支持自然的多模态交互...

🚀重磅首发!本地部署+真实测评阿里开源视觉大模型Qwen2.5-VL-7B-Instruct和Qwen2.5-VL-72B!轻松识别提取发票!全方位测评见证AI视觉理解能力的质的飞跃,图像识别不再是难题

1 minute read

2025年1月,阿里巴巴通义千问团队发布了全新的视觉语言模型——Qwen2.5-VL-7B-Instruct,作为Qwen2.5-VL系列的一员,标志着视觉语言理解领域的一次重要突破。这一中型参数模型,凭借其卓越的性能和多样化的功能,迅速吸引了业界的广泛关注。

Back to Top ↑

Mistral AI

🚀取代ChatGPT Operator!支持DeepSeek!Browser Use最强浏览器自动化框架,支持Roo Code轻松实现MCP Server集成Claude桌面版

1 minute read

Browser-use是一款开源的基于AI的智能浏览器自动化工具, 而且这款开源项目分为命令行版本和web UI版本,并且支持deepseek、gpt-4o在内的开源和闭源模型。 我们可以使用这款开源项目轻松实现浏览器自动化操作,执行订机票、浏览网页、点击链接、提取信息,甚至填写表单、订机票等复杂操作。 用户可以...

Back to Top ↑

Roo Code

🚀谷歌重磅发布Gemini 2.0 Pro!多模态能力大幅提升,训练数据质量高,编程能力强!多维度测评轻松识别手写汉字、提取模糊扫描内容,Roo Code+Gemini 2.0 Pro编程能力大幅提升

3 minute read

Gemini 2.0 Pro Experimental 是 Google 在 2025 年 2 月 5 日推出的最新实验性 AI 模型,作为 Gemini 2.0 系列的重要组成部分。该模型在编码能力、复杂提示处理及世界知识理解方面展现了当前最先进的性能,现通过 Gemini Advanced 订阅(每月 19....

🚀取代ChatGPT Operator!支持DeepSeek!Browser Use最强浏览器自动化框架,支持Roo Code轻松实现MCP Server集成Claude桌面版

1 minute read

Browser-use是一款开源的基于AI的智能浏览器自动化工具, 而且这款开源项目分为命令行版本和web UI版本,并且支持deepseek、gpt-4o在内的开源和闭源模型。 我们可以使用这款开源项目轻松实现浏览器自动化操作,执行订机票、浏览网页、点击链接、提取信息,甚至填写表单、订机票等复杂操作。 用户可以...

Back to Top ↑

multimoda

🚀本地部署OmniParser v2.0与pyautogui真正实现自动化点击!支持macOS、Windows与Linux!轻松实现自动化操作电脑!从服务端部署到客户端开发,从接口设计到自动化控制全流程

4 minute read

OmniParser V2.0是微软开发的一款先进开源AI工具,旨在将图形用户界面(GUI)截图转换为结构化数据。这一功能增强了大型语言模型(LLMs)与屏幕上视觉元素的互动,能够实现更加智能的自动化和用户辅助。

🚀vLLM本地部署Qwen2.5-VL多模态大模型!70亿参数即可打造监控视频目标查找项目!轻松实现监控视频自动找人!RTX A6000显卡部署Qwen2.5-VL-7B-Instruct模型实战教程

7 minute read

Qwen2.5-VL是阿里云开发的最新多模态大型语言模型,它在视觉理解、文档处理和多模态交互方面表现出色。在视觉理解方面,Qwen2.5-VL能够准确识别图像和视频中的物体、场景和关系,并进行描述。在文档处理方面,它擅长提取和分析各种类型的文档信息,包括文字、表格和图片。Qwen2.5-VL还支持自然的多模态交互...

Back to Top ↑

Anthropic

Claude颠覆性创新!MCP模型上下文协议!轻松为Claude加入搜索引擎、网页抓取、Text to SQL、文件管理、GitHub操作等功能!Model Context Protocol为AI开挂

1 minute read

人工智能公司Anthropic推出了模型上下文协议(Model Context Protocol,简称MCP),旨在为AI助手与外部数据源之间建立安全、标准化的连接。MCP作为开放协议,允许开发者在AI工具与各种数据源(如文件系统、数据库、API等)之间创建双向连接,提升AI系统的互操作性和功能扩展性。

Back to Top ↑

MCP

Claude颠覆性创新!MCP模型上下文协议!轻松为Claude加入搜索引擎、网页抓取、Text to SQL、文件管理、GitHub操作等功能!Model Context Protocol为AI开挂

1 minute read

人工智能公司Anthropic推出了模型上下文协议(Model Context Protocol,简称MCP),旨在为AI助手与外部数据源之间建立安全、标准化的连接。MCP作为开放协议,允许开发者在AI工具与各种数据源(如文件系统、数据库、API等)之间创建双向连接,提升AI系统的互操作性和功能扩展性。

Back to Top ↑

AI协议

Claude颠覆性创新!MCP模型上下文协议!轻松为Claude加入搜索引擎、网页抓取、Text to SQL、文件管理、GitHub操作等功能!Model Context Protocol为AI开挂

1 minute read

人工智能公司Anthropic推出了模型上下文协议(Model Context Protocol,简称MCP),旨在为AI助手与外部数据源之间建立安全、标准化的连接。MCP作为开放协议,允许开发者在AI工具与各种数据源(如文件系统、数据库、API等)之间创建双向连接,提升AI系统的互操作性和功能扩展性。

Back to Top ↑

Claude 3.5

Claude颠覆性创新!MCP模型上下文协议!轻松为Claude加入搜索引擎、网页抓取、Text to SQL、文件管理、GitHub操作等功能!Model Context Protocol为AI开挂

1 minute read

人工智能公司Anthropic推出了模型上下文协议(Model Context Protocol,简称MCP),旨在为AI助手与外部数据源之间建立安全、标准化的连接。MCP作为开放协议,允许开发者在AI工具与各种数据源(如文件系统、数据库、API等)之间创建双向连接,提升AI系统的互操作性和功能扩展性。

Back to Top ↑

AI工具

Claude颠覆性创新!MCP模型上下文协议!轻松为Claude加入搜索引擎、网页抓取、Text to SQL、文件管理、GitHub操作等功能!Model Context Protocol为AI开挂

1 minute read

人工智能公司Anthropic推出了模型上下文协议(Model Context Protocol,简称MCP),旨在为AI助手与外部数据源之间建立安全、标准化的连接。MCP作为开放协议,允许开发者在AI工具与各种数据源(如文件系统、数据库、API等)之间创建双向连接,提升AI系统的互操作性和功能扩展性。

Back to Top ↑

Llama 3.3

Back to Top ↑

Meta

Back to Top ↑

Open Source

Back to Top ↑

Language Model

Back to Top ↑

GraphRAG

GraphRAG 1.0重磅升级!颠覆传统RAG!DRIFT搜索+Update命令!整合LM Studio本地大模型实现高效RAG!MarkItDown将PDF转为markdown!性能提升3倍

less than 1 minute read

微软于2024年12月16日正式发布了GraphRAG 1.0,这是一个将图结构数据与检索增强生成(RAG)模型相结合的开源工具,旨在提升自然语言处理任务的性能。GraphRAG 1.0的主要特点包括DRIFT搜索算法、Update命令以及与LM Studio的整合,使得用户能够更高效地处理图结构数据。此外,微软...

Back to Top ↑

微软

GraphRAG 1.0重磅升级!颠覆传统RAG!DRIFT搜索+Update命令!整合LM Studio本地大模型实现高效RAG!MarkItDown将PDF转为markdown!性能提升3倍

less than 1 minute read

微软于2024年12月16日正式发布了GraphRAG 1.0,这是一个将图结构数据与检索增强生成(RAG)模型相结合的开源工具,旨在提升自然语言处理任务的性能。GraphRAG 1.0的主要特点包括DRIFT搜索算法、Update命令以及与LM Studio的整合,使得用户能够更高效地处理图结构数据。此外,微软...

Back to Top ↑

Ai智能体

ScrapeGraphAI开启智能数据抓取新时代!用AI重塑数据提取方式!ScrapeGraphAI+LangChain+LangGraph打造最强文章采集和写作AI智能体!让内容创作更简单

7 minute read

传统的网页抓取工具严重依赖于预定义的规则和模式,一旦目标网站的结构发生变化,就需要手动更新代码,耗时费力。而 ScrapeGraphAI 则另辟蹊径,它利用 LLMs 的强大理解能力,让用户只需用自然语言描述所需数据,剩下的复杂工作全部交给 AI 完成!

Back to Top ↑

爬虫

ScrapeGraphAI开启智能数据抓取新时代!用AI重塑数据提取方式!ScrapeGraphAI+LangChain+LangGraph打造最强文章采集和写作AI智能体!让内容创作更简单

7 minute read

传统的网页抓取工具严重依赖于预定义的规则和模式,一旦目标网站的结构发生变化,就需要手动更新代码,耗时费力。而 ScrapeGraphAI 则另辟蹊径,它利用 LLMs 的强大理解能力,让用户只需用自然语言描述所需数据,剩下的复杂工作全部交给 AI 完成!

Back to Top ↑

LangChain

ScrapeGraphAI开启智能数据抓取新时代!用AI重塑数据提取方式!ScrapeGraphAI+LangChain+LangGraph打造最强文章采集和写作AI智能体!让内容创作更简单

7 minute read

传统的网页抓取工具严重依赖于预定义的规则和模式,一旦目标网站的结构发生变化,就需要手动更新代码,耗时费力。而 ScrapeGraphAI 则另辟蹊径,它利用 LLMs 的强大理解能力,让用户只需用自然语言描述所需数据,剩下的复杂工作全部交给 AI 完成!

Back to Top ↑

LangGraph

ScrapeGraphAI开启智能数据抓取新时代!用AI重塑数据提取方式!ScrapeGraphAI+LangChain+LangGraph打造最强文章采集和写作AI智能体!让内容创作更简单

7 minute read

传统的网页抓取工具严重依赖于预定义的规则和模式,一旦目标网站的结构发生变化,就需要手动更新代码,耗时费力。而 ScrapeGraphAI 则另辟蹊径,它利用 LLMs 的强大理解能力,让用户只需用自然语言描述所需数据,剩下的复杂工作全部交给 AI 完成!

Back to Top ↑

smolagents

smolagents颠覆传统AI智能体!ollama本地部署Hugging Face开源全新AI智能体!重新定义AI智能体开发!从入门到精通只需10分钟

6 minute read

HuggingFace于2024年12月31日发布了一款全新的AI代理框架SmolAgents,这是一个极简但功能强大的AI Agents库,可以让开发者用最少的代码快速构建智能代理系统。该框架的核心逻辑仅用约1000行代码就实现了完整的代理功能,极大地简化了AI代理的开发流程。

Back to Top ↑

Hugging Face

smolagents颠覆传统AI智能体!ollama本地部署Hugging Face开源全新AI智能体!重新定义AI智能体开发!从入门到精通只需10分钟

6 minute read

HuggingFace于2024年12月31日发布了一款全新的AI代理框架SmolAgents,这是一个极简但功能强大的AI Agents库,可以让开发者用最少的代码快速构建智能代理系统。该框架的核心逻辑仅用约1000行代码就实现了完整的代理功能,极大地简化了AI代理的开发流程。

Back to Top ↑

教程

smolagents颠覆传统AI智能体!ollama本地部署Hugging Face开源全新AI智能体!重新定义AI智能体开发!从入门到精通只需10分钟

6 minute read

HuggingFace于2024年12月31日发布了一款全新的AI代理框架SmolAgents,这是一个极简但功能强大的AI Agents库,可以让开发者用最少的代码快速构建智能代理系统。该框架的核心逻辑仅用约1000行代码就实现了完整的代理功能,极大地简化了AI代理的开发流程。

Back to Top ↑

Roo Cline

Back to Top ↑

Phi-4

Back to Top ↑

LitGPT

Back to Top ↑

AIAgents

微软最强AI智能体AutoGen史诗级更新!原生支持Magentic-One和Swarm与Teams!引领AI智能体元年!支持ollama本地部署!小白也能轻松掌握AI框架保姆级教程,超详细上手指南

8 minute read

AutoGen 是一个用于构建代理 AI 应用程序的开源框架,允许开发者创建可以自主行动或与人类协作的多代理 AI 系统。AutoGen 0.4.2 是一个重要的更新版本,它在代理工作流程中提高了代码质量、稳健性、通用性和可扩展性。新的异步、事件驱动的架构使 AutoGen 更具可扩展性和稳健性,从而支持更广泛的...

Back to Top ↑

Llama3.2

微软最强AI智能体AutoGen史诗级更新!原生支持Magentic-One和Swarm与Teams!引领AI智能体元年!支持ollama本地部署!小白也能轻松掌握AI框架保姆级教程,超详细上手指南

8 minute read

AutoGen 是一个用于构建代理 AI 应用程序的开源框架,允许开发者创建可以自主行动或与人类协作的多代理 AI 系统。AutoGen 0.4.2 是一个重要的更新版本,它在代理工作流程中提高了代码质量、稳健性、通用性和可扩展性。新的异步、事件驱动的架构使 AutoGen 更具可扩展性和稳健性,从而支持更广泛的...

Back to Top ↑

Magentic-One

微软最强AI智能体AutoGen史诗级更新!原生支持Magentic-One和Swarm与Teams!引领AI智能体元年!支持ollama本地部署!小白也能轻松掌握AI框架保姆级教程,超详细上手指南

8 minute read

AutoGen 是一个用于构建代理 AI 应用程序的开源框架,允许开发者创建可以自主行动或与人类协作的多代理 AI 系统。AutoGen 0.4.2 是一个重要的更新版本,它在代理工作流程中提高了代码质量、稳健性、通用性和可扩展性。新的异步、事件驱动的架构使 AutoGen 更具可扩展性和稳健性,从而支持更广泛的...

Back to Top ↑

Swarm

微软最强AI智能体AutoGen史诗级更新!原生支持Magentic-One和Swarm与Teams!引领AI智能体元年!支持ollama本地部署!小白也能轻松掌握AI框架保姆级教程,超详细上手指南

8 minute read

AutoGen 是一个用于构建代理 AI 应用程序的开源框架,允许开发者创建可以自主行动或与人类协作的多代理 AI 系统。AutoGen 0.4.2 是一个重要的更新版本,它在代理工作流程中提高了代码质量、稳健性、通用性和可扩展性。新的异步、事件驱动的架构使 AutoGen 更具可扩展性和稳健性,从而支持更广泛的...

Back to Top ↑

Janus-Pro

Back to Top ↑

Janus-Pro-7B

Back to Top ↑

Stable Diffusion

Back to Top ↑

视觉模型

Back to Top ↑

文生图模型

Back to Top ↑

Qwen2.5-Max

Back to Top ↑

Qwen2.5-VL-7B

🚀重磅首发!本地部署+真实测评阿里开源视觉大模型Qwen2.5-VL-7B-Instruct和Qwen2.5-VL-72B!轻松识别提取发票!全方位测评见证AI视觉理解能力的质的飞跃,图像识别不再是难题

1 minute read

2025年1月,阿里巴巴通义千问团队发布了全新的视觉语言模型——Qwen2.5-VL-7B-Instruct,作为Qwen2.5-VL系列的一员,标志着视觉语言理解领域的一次重要突破。这一中型参数模型,凭借其卓越的性能和多样化的功能,迅速吸引了业界的广泛关注。

Back to Top ↑

Qwen2.5-VL-72B

🚀重磅首发!本地部署+真实测评阿里开源视觉大模型Qwen2.5-VL-7B-Instruct和Qwen2.5-VL-72B!轻松识别提取发票!全方位测评见证AI视觉理解能力的质的飞跃,图像识别不再是难题

1 minute read

2025年1月,阿里巴巴通义千问团队发布了全新的视觉语言模型——Qwen2.5-VL-7B-Instruct,作为Qwen2.5-VL系列的一员,标志着视觉语言理解领域的一次重要突破。这一中型参数模型,凭借其卓越的性能和多样化的功能,迅速吸引了业界的广泛关注。

Back to Top ↑

Mistral Small 3

Back to Top ↑

Mistral-Small-24B-Instruct-2501

Back to Top ↑

Mistral

Back to Top ↑

Mistral-Small-24B-

Back to Top ↑

开源大模型

Back to Top ↑

Browser Use

🚀取代ChatGPT Operator!支持DeepSeek!Browser Use最强浏览器自动化框架,支持Roo Code轻松实现MCP Server集成Claude桌面版

1 minute read

Browser-use是一款开源的基于AI的智能浏览器自动化工具, 而且这款开源项目分为命令行版本和web UI版本,并且支持deepseek、gpt-4o在内的开源和闭源模型。 我们可以使用这款开源项目轻松实现浏览器自动化操作,执行订机票、浏览网页、点击链接、提取信息,甚至填写表单、订机票等复杂操作。 用户可以...

Back to Top ↑

Web UI

🚀取代ChatGPT Operator!支持DeepSeek!Browser Use最强浏览器自动化框架,支持Roo Code轻松实现MCP Server集成Claude桌面版

1 minute read

Browser-use是一款开源的基于AI的智能浏览器自动化工具, 而且这款开源项目分为命令行版本和web UI版本,并且支持deepseek、gpt-4o在内的开源和闭源模型。 我们可以使用这款开源项目轻松实现浏览器自动化操作,执行订机票、浏览网页、点击链接、提取信息,甚至填写表单、订机票等复杂操作。 用户可以...

Back to Top ↑

MCP Server

🚀取代ChatGPT Operator!支持DeepSeek!Browser Use最强浏览器自动化框架,支持Roo Code轻松实现MCP Server集成Claude桌面版

1 minute read

Browser-use是一款开源的基于AI的智能浏览器自动化工具, 而且这款开源项目分为命令行版本和web UI版本,并且支持deepseek、gpt-4o在内的开源和闭源模型。 我们可以使用这款开源项目轻松实现浏览器自动化操作,执行订机票、浏览网页、点击链接、提取信息,甚至填写表单、订机票等复杂操作。 用户可以...

Back to Top ↑

Claude

🚀取代ChatGPT Operator!支持DeepSeek!Browser Use最强浏览器自动化框架,支持Roo Code轻松实现MCP Server集成Claude桌面版

1 minute read

Browser-use是一款开源的基于AI的智能浏览器自动化工具, 而且这款开源项目分为命令行版本和web UI版本,并且支持deepseek、gpt-4o在内的开源和闭源模型。 我们可以使用这款开源项目轻松实现浏览器自动化操作,执行订机票、浏览网页、点击链接、提取信息,甚至填写表单、订机票等复杂操作。 用户可以...

Back to Top ↑

ChatGPT Operator

🚀取代ChatGPT Operator!支持DeepSeek!Browser Use最强浏览器自动化框架,支持Roo Code轻松实现MCP Server集成Claude桌面版

1 minute read

Browser-use是一款开源的基于AI的智能浏览器自动化工具, 而且这款开源项目分为命令行版本和web UI版本,并且支持deepseek、gpt-4o在内的开源和闭源模型。 我们可以使用这款开源项目轻松实现浏览器自动化操作,执行订机票、浏览网页、点击链接、提取信息,甚至填写表单、订机票等复杂操作。 用户可以...

Back to Top ↑

node-DeepResearch

Back to Top ↑

DeepResearch

Back to Top ↑

AI agent

Back to Top ↑

AI agents

Back to Top ↑

Gemini 2.0 Pro

🚀谷歌重磅发布Gemini 2.0 Pro!多模态能力大幅提升,训练数据质量高,编程能力强!多维度测评轻松识别手写汉字、提取模糊扫描内容,Roo Code+Gemini 2.0 Pro编程能力大幅提升

3 minute read

Gemini 2.0 Pro Experimental 是 Google 在 2025 年 2 月 5 日推出的最新实验性 AI 模型,作为 Gemini 2.0 系列的重要组成部分。该模型在编码能力、复杂提示处理及世界知识理解方面展现了当前最先进的性能,现通过 Gemini Advanced 订阅(每月 19....

Back to Top ↑

Gemini 2.0 Pro Experimental

🚀谷歌重磅发布Gemini 2.0 Pro!多模态能力大幅提升,训练数据质量高,编程能力强!多维度测评轻松识别手写汉字、提取模糊扫描内容,Roo Code+Gemini 2.0 Pro编程能力大幅提升

3 minute read

Gemini 2.0 Pro Experimental 是 Google 在 2025 年 2 月 5 日推出的最新实验性 AI 模型,作为 Gemini 2.0 系列的重要组成部分。该模型在编码能力、复杂提示处理及世界知识理解方面展现了当前最先进的性能,现通过 Gemini Advanced 订阅(每月 19....

Back to Top ↑

Gemini

🚀谷歌重磅发布Gemini 2.0 Pro!多模态能力大幅提升,训练数据质量高,编程能力强!多维度测评轻松识别手写汉字、提取模糊扫描内容,Roo Code+Gemini 2.0 Pro编程能力大幅提升

3 minute read

Gemini 2.0 Pro Experimental 是 Google 在 2025 年 2 月 5 日推出的最新实验性 AI 模型,作为 Gemini 2.0 系列的重要组成部分。该模型在编码能力、复杂提示处理及世界知识理解方面展现了当前最先进的性能,现通过 Gemini Advanced 订阅(每月 19....

Back to Top ↑

AIGC

🚀谷歌重磅发布Gemini 2.0 Pro!多模态能力大幅提升,训练数据质量高,编程能力强!多维度测评轻松识别手写汉字、提取模糊扫描内容,Roo Code+Gemini 2.0 Pro编程能力大幅提升

3 minute read

Gemini 2.0 Pro Experimental 是 Google 在 2025 年 2 月 5 日推出的最新实验性 AI 模型,作为 Gemini 2.0 系列的重要组成部分。该模型在编码能力、复杂提示处理及世界知识理解方面展现了当前最先进的性能,现通过 Gemini Advanced 订阅(每月 19....

Back to Top ↑

DeepSeek-R1

🚀微调DeepSeek-R1-Distill-Llama-8B打造SQL语言转自然语言大模型!小白也能十分钟打造自己的推理大模型!unsloth+Colab轻松上手

4 minute read

DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数语言模型,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。通过蒸馏技术,模型在保持较高性能的同时,减少了计算资源的消耗,特别适合在资源受限的环境中应用。该模型经过优化,可用于多种自然语言处理任...

Back to Top ↑

DeepSeek-R1-Distill-Llama-8B

🚀微调DeepSeek-R1-Distill-Llama-8B打造SQL语言转自然语言大模型!小白也能十分钟打造自己的推理大模型!unsloth+Colab轻松上手

4 minute read

DeepSeek-R1-Distill-Llama-8B 是一个基于 Llama 架构的 8B 参数语言模型,经过深度蒸馏(distillation)处理,旨在提高推理效率和精度。通过蒸馏技术,模型在保持较高性能的同时,减少了计算资源的消耗,特别适合在资源受限的环境中应用。该模型经过优化,可用于多种自然语言处理任...

Back to Top ↑

Qwen

🚀vLLM本地部署Qwen2.5-VL多模态大模型!70亿参数即可打造监控视频目标查找项目!轻松实现监控视频自动找人!RTX A6000显卡部署Qwen2.5-VL-7B-Instruct模型实战教程

7 minute read

Qwen2.5-VL是阿里云开发的最新多模态大型语言模型,它在视觉理解、文档处理和多模态交互方面表现出色。在视觉理解方面,Qwen2.5-VL能够准确识别图像和视频中的物体、场景和关系,并进行描述。在文档处理方面,它擅长提取和分析各种类型的文档信息,包括文字、表格和图片。Qwen2.5-VL还支持自然的多模态交互...

Back to Top ↑

OmniParser

🚀本地部署OmniParser v2.0与pyautogui真正实现自动化点击!支持macOS、Windows与Linux!轻松实现自动化操作电脑!从服务端部署到客户端开发,从接口设计到自动化控制全流程

4 minute read

OmniParser V2.0是微软开发的一款先进开源AI工具,旨在将图形用户界面(GUI)截图转换为结构化数据。这一功能增强了大型语言模型(LLMs)与屏幕上视觉元素的互动,能够实现更加智能的自动化和用户辅助。

Back to Top ↑

OmniParser v2.0

🚀本地部署OmniParser v2.0与pyautogui真正实现自动化点击!支持macOS、Windows与Linux!轻松实现自动化操作电脑!从服务端部署到客户端开发,从接口设计到自动化控制全流程

4 minute read

OmniParser V2.0是微软开发的一款先进开源AI工具,旨在将图形用户界面(GUI)截图转换为结构化数据。这一功能增强了大型语言模型(LLMs)与屏幕上视觉元素的互动,能够实现更加智能的自动化和用户辅助。

Back to Top ↑

pyautogui

🚀本地部署OmniParser v2.0与pyautogui真正实现自动化点击!支持macOS、Windows与Linux!轻松实现自动化操作电脑!从服务端部署到客户端开发,从接口设计到自动化控制全流程

4 minute read

OmniParser V2.0是微软开发的一款先进开源AI工具,旨在将图形用户界面(GUI)截图转换为结构化数据。这一功能增强了大型语言模型(LLMs)与屏幕上视觉元素的互动,能够实现更加智能的自动化和用户辅助。

Back to Top ↑

PaliGemma

Back to Top ↑

PaliGemma 2

Back to Top ↑

PaliGemma 2 mix

Back to Top ↑

OCR

Back to Top ↑