Recent Posts

🚀谷歌重磅发布Gemini 2.0 Pro!多模态能力大幅提升,训练数据质量高,编程能力强!多维度测评轻松识别手写汉字、提取模糊扫描内容,Roo Code+Gemini 2.0 Pro编程能力大幅提升

3 minute read

Gemini 2.0 Pro Experimental 是 Google 在 2025 年 2 月 5 日推出的最新实验性 AI 模型,作为 Gemini 2.0 系列的重要组成部分。该模型在编码能力、复杂提示处理及世界知识理解方面展现了当前最先进的性能,现通过 Gemini Advanced 订阅(每月 19....

🚀取代ChatGPT Operator!支持DeepSeek!Browser Use最强浏览器自动化框架,支持Roo Code轻松实现MCP Server集成Claude桌面版

1 minute read

Browser-use是一款开源的基于AI的智能浏览器自动化工具, 而且这款开源项目分为命令行版本和web UI版本,并且支持deepseek、gpt-4o在内的开源和闭源模型。 我们可以使用这款开源项目轻松实现浏览器自动化操作,执行订机票、浏览网页、点击链接、提取信息,甚至填写表单、订机票等复杂操作。 用户可以...

🚀重磅首发!本地部署+真实测评阿里开源视觉大模型Qwen2.5-VL-7B-Instruct和Qwen2.5-VL-72B!轻松识别提取发票!全方位测评见证AI视觉理解能力的质的飞跃,图像识别不再是难题

1 minute read

2025年1月,阿里巴巴通义千问团队发布了全新的视觉语言模型——Qwen2.5-VL-7B-Instruct,作为Qwen2.5-VL系列的一员,标志着视觉语言理解领域的一次重要突破。这一中型参数模型,凭借其卓越的性能和多样化的功能,迅速吸引了业界的广泛关注。