2025开年小记
过了春节才算是正式开始了 2025,也是时候做一个正式的总结了!
回顾 2024
回顾 2024,我有两个比较大的收获,一个是在 Morph Studio 的时候,可以说是我作为技术负责人完全操刀的一整个大项目,实践了很多之前的设计和想法。整体来看,我非常满意这一段时间的工作,从技能的角度上来说,应有如下提升:
- PGSQL +++
- Redis +++
- FastAPI +++
- 消息队列、多集群、GPU +++
- AIGC: Anything to Video +++
其他综合能力上,更多的是教训,比如:
- 团队管理上,需要有一些职责划分,不然容易造成事情堆积和无法分发
- 项目管理上,需要有更明确、更流畅的方式,不要因为一些小问题而影响整个项目的进度
另外,有一些思路上的改变,比如:
- 云的使用对于业务的快速发展是有利的,创业公司可以很快地基于此构建产品,但云的成本也是一个问题,需要有一些成本控制的方法,必要的时候可以考虑自建
年底加入 Arco 后,我更多的是作为工程师负责模块的开发和整体系统集成、DevOps工作,明显感觉到责任划分更加明确、自己的职责也更少,不过这不是我放松的理由,我很清楚我花更多精力和时间探索LLM的边界,正如所有从业者都在做的一样。目前来看,仍然没有一个四海皆准的范式,模型也在持续进步,大家都在尽可能的探索如何让模型更好地服务于业务。在春节前的版本rush中,我也算是入门了基于LLM的应用开发。
- LLM应用开发 +
在工作中我仍然存在很多不足,一方面是经验上的,但更重要的是认知上的,目前深感对LLM驱动开发的研究还不够深入,仅有一些基础的实践和基础的知识,这方面的提升将是2025年的重点。
另外,我更意识到一个人赢得尊重不一定只能依靠实力,只依靠实力最后总会有力所不及的地方,而真正让一个人赢得尊重的,应该是其在解决问题的过程中表现出的态度、方法,重要的是旅途中的风景和收获,而不是终点的荣誉和地位。
近期思考
Deepseek的成功代表了两点:LLM技术不可能被某一国垄断,即技术自由流动;LLM的普惠化正在路上,也是LLM产业化、真正兑现商业价值的唯一方式。
如此来看,2025年,我们不能再用成本等原因作为借口而不去实践需要大量计算的LLM优化技术,相反,我们应当把LLM的持续普惠化作为后续技术决策的重要参考,我们需要保持一个信念:如果LLM的大推理时代来临,我们需要有足够的技术积累和认知积累,以跑在所有人的前面。
展望 2025
近期来看,我需要更加深入Agent相关技术,从function call、手动规划到自动规划,这可能是2025年贯穿全年的主题。其次,注意一些LLM的微调、蒸馏方案,这可能是2025年对于业务来说比较重要的技术积累。
从全世界的角度上来看,2025年LLM应当实现在推理层面的scaling law,我不认为2025会在多模态和机器人上有重大突破,但推理层面的进一步研究,将带来模型能力、稳定性和成本的大幅度优化。
最后一点
个人上,2024的减肥大业没有完成,甚至没有什么进展,2025需要从两方面入手:
- 持续的练:首先是保持一定的运动量,每日健身房和周末的打球活动需要持续下去
- 持续的减:其次是饮食的控制,虽然很多时候很忙,又想着放纵一下,但是对每周的放纵次数要有一些限制