人工智能(AI)的发展日新月异,从最初的科幻概念,到如今深刻影响我们工作与生活的实用工具,其演进速度令人惊叹。作为技术从业者,我与AI工具的“交集”始于对效率提升的需求,但随着体验的深入,这份“交集”逐渐演变为一场关于技术认知迭代的探索。希望通过这篇博客,记录下我个人从接触早期模型到如今运用多种AI产品的体验与思考。 
- Claude:
- 优势: 在使用ChatGPT的同时,也经常关注和尝试Claude。根据许多评测和我的实际体验,Claude在代码生成和理解方面表现尤为突出。因此,在工作中涉及编程任务时,它是我常用的首选。
- 使用场景: 字节跳动的编程工具Trae内置了其Claude3.5和3.7版本,不再受代理问题影响,其AI代码能力与编程工具的结合,让人可快速小的功能需求。
- Google Gemini:
- 优点:支持100万的Token输入,强大的多模态能力,能出色地理解图片内容,并将识别结果按需转换成特定格式的文档。目前在公司项目的功能点估算(Function Point Estimation)测评中,它的表现也是最优的。
- 使用场景:各方面。
- 通义千问(Qwen):
- 特点: 国内开源模型的佼佼者,在DeepSeek崭露头角前曾是开源模型的领先者。虽然一度被DeepSeek R1的光芒掩盖,但其持续迭代,目前比R1多了多模态能力。5月新出的qwen3-235b-a22b有一战之力。
- 优势: 处理各类问题时表现稳健,回答客观,幻觉问题相对较少。
- 使用场景: 对于那些不需要太多创意、更侧重于准确性和稳定性的“固定”任务,我倾向于交给千问处理。
- 豆包(Doubao):
- 特点: 早期作为问答AI时能力尚有不足,但发展到当前的1.5 pro thinking模型后,在解决办公场景问答、处理日常信息等方面表现出色。
- 优势: 产品能力突出,用户体验友好,桌面应用能力强。技术文档解析、会议总结等功能体验不错。
- 使用场景: 一个优秀的办公和生活信息处理助手,能有效辅助用户完成信息处理任务。
- 阶跃星辰:
- 特点: 国内最庞大的参数规模引人注目。
- 使用场景: 随着千问、豆包等模型最新版本的发布,以及Gemini在图像识别上的卓越表现,阶跃星辰在图片理解上的优势似乎不再明显,导致我目前使用它的频率有所下降。
- 秘塔:
- 优点:学术搜索体验优秀,引用来源有依据。
- 使用场景:基于实事实的提问,生活类、科普类问题。
四、 进阶探索:知识库与多智能体协作(MCP) 在使用AI的过程中,我也尝试了更高级的应用方式:
- 知识库(Knowledge Base / RAG): 我的经验是,构建垂直领域的知识库效果更佳。例如,将我自己博客中的原创文章作为知识库,相比于将整个博客内容(可能包含转载、评论等)都纳入,针对性问题的回答质量和相关性会显著提高。此外,使用如Cherry Studio之类的工具时,经测试,采用两个或以上的知识库比单一知识库有更好的回答能力,即相同的知识内容用多个嵌入模型来索引,加上重排模型会更好。
- 多智能体协作平台(MCP - Multi-Agent Collaboration Platform): 这方面我还处于初步探索阶段,尚未找到特别契合的、能显著提升效率的应用场景和配合方式,没有成型的工作流,仍在持续关注和尝试中。
结语 回顾我的AI使用历程,是从最初的工具化应用,到逐渐认识其推理潜力,再到如今根据不同模型的特性进行差异化、组合化使用。AI已经从一个简单的信息助手,演变为能够辅助思考、激发创意、甚至在特定领域超越人类效率的“伙伴”。 随着工具的迭代,或许会有更多“惊喜型”AI出现,但核心逻辑不会变:明确需求、善用特性、规避缺陷,根据具体任务需求,选择最合适的AI进行协作,才能让AI真正成为提升效率与创造力的“第二大脑”。 未来,期待AI为我们的工作和生活带来更多积极的改变。



评论