人工智能(AI)的发展日新月异,从最初的科幻概念,到如今深刻影响我们工作与生活的实用工具,其演进速度令人惊叹。作为技术从业者,我与AI工具的“交集”始于对效率提升的需求,但随着体验的深入,这份“交集”逐渐演变为一场关于技术认知迭代的探索。希望通过这篇博客,记录下我个人从接触早期模型到如今运用多种AI产品的体验与思考。 一、 初识AI:超越搜索引擎的工具 我最早接触并规模化使用生成式AI,大约是从ChatGPT 3.5版本开始。坦诚地说,我对AI能模拟甚至拥有人类思维的说法持怀疑态度。我更多地将其视为一个直达问题的搜索引擎和高效翻译器。 一个典型的应用场景是查找老旧技术资料文档。例如,像Informix这样的早期数据库,其官方文档在Google上已难觅踪迹,零散找到的内容翻译起来也费时费力。此时,向ChatGPT 3.5提问,往往能获得比传统搜索更整合、更直接的中文答案,极大地提高了信息获取效率,减少理解老技术难度。 然而,早期使用也伴随着门槛。注册ChatGPT需要国外手机号,而代理软件的不稳定常常导致访问中断。为了更顺畅地体验,我转向了一些国内的AI聚合平台,例如阿水AI,这让我能在第一时间接触到更新的模型,比如ChatGPT4.0,尽管响应速度可能较慢,但对于解答一些具体的技术问题,其准确性还是比较可信的。 二、 惊艳与反思:推理能力的曙光与幻觉的阴影 2025年1月份,农历新年期间,DeepSeek R1的出现标志着我们AI使用体验的一个重要转折点。我对其展现出的推理能力感到惊喜。生成式AI,在我看来只处于意识的表象思维阶段,无论回答多完整,我都只当它一位很会抄书的大专生或本科生。R1表现出来的推理能力,让原来只有表象思维的AI能够通过能理解更复杂的问题,开始拥有部分的抽象能力。R1能生成符合内存逻辑的连贯的文章和回答。我知道到,这种推理能力的萌芽,是AI从简单模仿迈向更深层次思维的一步。 但R1的幻觉问题很严重,经常一本正经的胡说八道,在大段内容中夹杂着事实性错误,尤其是历史、地理、旅游等领域。与此同时,它的创意比较好,在问答一些方案类问题,只有一些原始概念时,它能给出比较好的创意或行动方案,可以让在开始某项事情时有入手的地方。当然,也不要太相信它方案的可靠性。之前,按它的方案优化Wordpress博客,很多都是行不通。 在R1之后出现了一些能力强的新模型,我就不用R1来问答一两句话能问完的问题。现在使用都是有大量上下文,或结合联网搜索或知识库来限制它推理的范围,减少R1胡编乱造的情况。我觉得他结合知识库的限制,能作为很多产品的官方的客服代表。 自此,我开始尝试让AI处理中等复杂度的问题。 三、 百花齐放:各大模型的差异化体验与应用策略 随着体验的深入,我对不同AI产品的特性有了更细致的了解和不同的使用偏好:

  1. Claude:
  • 优势: 在使用ChatGPT的同时,也经常关注和尝试Claude。根据许多评测和我的实际体验,Claude在代码生成和理解方面表现尤为突出。因此,在工作中涉及编程任务时,它是我常用的首选。
  • 使用场景: 字节跳动的编程工具Trae内置了其Claude3.5和3.7版本,不再受代理问题影响,其AI代码能力与编程工具的结合,让人可快速小的功能需求。
  1. Google Gemini:
  • 优点:支持100万的Token输入,强大的多模态能力,能出色地理解图片内容,并将识别结果按需转换成特定格式的文档。目前在公司项目的功能点估算(Function Point Estimation)测评中,它的表现也是最优的。
  • 使用场景:各方面。
  1. 通义千问(Qwen):
  • 特点: 国内开源模型的佼佼者,在DeepSeek崭露头角前曾是开源模型的领先者。虽然一度被DeepSeek R1的光芒掩盖,但其持续迭代,目前比R1多了多模态能力。5月新出的qwen3-235b-a22b有一战之力。
  • 优势: 处理各类问题时表现稳健,回答客观,幻觉问题相对较少。
  • 使用场景: 对于那些不需要太多创意、更侧重于准确性和稳定性的“固定”任务,我倾向于交给千问处理。
  1. 豆包(Doubao):
  • 特点: 早期作为问答AI时能力尚有不足,但发展到当前的1.5 pro thinking模型后,在解决办公场景问答、处理日常信息等方面表现出色。
  • 优势: 产品能力突出,用户体验友好,桌面应用能力强。技术文档解析、会议总结等功能体验不错。
  • 使用场景: 一个优秀的办公和生活信息处理助手,能有效辅助用户完成信息处理任务。
  1. 阶跃星辰:
  • 特点: 国内最庞大的参数规模引人注目。
  • 使用场景: 随着千问、豆包等模型最新版本的发布,以及Gemini在图像识别上的卓越表现,阶跃星辰在图片理解上的优势似乎不再明显,导致我目前使用它的频率有所下降。
  1. 秘塔:
  • 优点:学术搜索体验优秀,引用来源有依据。
  • 使用场景:基于实事实的提问,生活类、科普类问题。

四、 进阶探索:知识库与多智能体协作(MCP) 在使用AI的过程中,我也尝试了更高级的应用方式:

  • 知识库(Knowledge Base / RAG): 我的经验是,构建垂直领域的知识库效果更佳。例如,将我自己博客中的原创文章作为知识库,相比于将整个博客内容(可能包含转载、评论等)都纳入,针对性问题的回答质量和相关性会显著提高。此外,使用如Cherry Studio之类的工具时,经测试,采用两个或以上的知识库比单一知识库有更好的回答能力,即相同的知识内容用多个嵌入模型来索引,加上重排模型会更好。
  • 多智能体协作平台(MCP - Multi-Agent Collaboration Platform): 这方面我还处于初步探索阶段,尚未找到特别契合的、能显著提升效率的应用场景和配合方式,没有成型的工作流,仍在持续关注和尝试中。

结语 回顾我的AI使用历程,是从最初的工具化应用,到逐渐认识其推理潜力,再到如今根据不同模型的特性进行差异化、组合化使用。AI已经从一个简单的信息助手,演变为能够辅助思考、激发创意、甚至在特定领域超越人类效率的“伙伴”。 随着工具的迭代,或许会有更多“惊喜型”AI出现,但核心逻辑不会变:明确需求、善用特性、规避缺陷,根据具体任务需求,选择最合适的AI进行协作,才能让AI真正成为提升效率与创造力的“第二大脑”。 未来,期待AI为我们的工作和生活带来更多积极的改变。