ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
百川投资的第一个AI应用公司,想做Z世代的投资版小红书
6089点击    2024-11-20 14:04


百川智能创始人王小川是她的第一个老板,清华大学计算机系教授唐杰是她的项目老师,而她还是月之暗面几位创始人的本科辅导员。


在中国大模型的AI应用创业者中,大概很少有人像许丹青一样,如此醒目地穿梭于中国底座大模型的人物关系图谱中。当然,这一切都抵不过她与大模型的另一种因缘:在2022年ChatGPT诞生那天(中国时间12月1日),她也生了自己的第一个孩子。


对于一名女性创业者来说,某种意义上,这也是一种天意般的召唤。而更理性的一种考量,则是她是当下最适合做AI+金融这件事的人之一。


早在2009年的大三,许丹青就师从清华大学人工智能实验室马少平教授,基于社交与新闻数据,用深度学习的方法,做金融市场预测相关的研究。之后,她不仅以一作身份发表2篇人工智能顶级会议论文,还在2012年获得全球西贝尔学者奖。


毕业后,许丹青先在搜狗做AI助手,后转战金融科技领域十余年,在小米以及通联数据等公司,一直尝试着如何把AI技术和金融场景更好地结合。


2024年春节,许丹青创立金融领域的AI原生应用公司智策领航。前不久,智策领航拿到百川的战略投资,成为百川投资的第一家AI应用公司。目前已推出产品财搭子,小程序版也已上线。


关于如何给z世代投资者重新定义一个崭新的投资工具,以及一个AI+金融的应用公司该如何在大厂、大模型公司以及传统金融公司的缝隙中突围,许丹青有自己的思考和理解。


以下是她的口述:


最早的三份TS


2023年2月,还没休完产假,我就返回通联数据工作。这时,唐杰老师找到我,希望我加入智谱AI。


早年我在清华大学计算机系读书时,唐杰就是我的项目老师,当时会一起参与很多学术会议。智谱早期创业时,我们也有过很多交流。


那天,我们聊得很深入。他和我讲述了他做智谱长达5-10年的愿景,他对AGI的信仰非常恳切,深深感染了我,驱使我自己去思考未来10年我的人生使命是什么。


回答好这个问题,我差不多用了一年时间。过去10年金融科技领域的经验告诉我,AI这件事一定要和场景结合才能发光发热。所以我决定自己创业做AI+金融的第一批原生应用。


2024年春节后,我快速组建了一个5人的核心团队。然后我找到唐杰老师,询问他能否支持我。他说没问题。智谱当时有面向初创公司提供投资和技术等资源支持的z计划,由于当时还是孵化基金,只能跟投,他就让我去了解下市场情况。


聊了四五家后,我拿到三份TS。先是投了很多AI公司的一家一线基金。他们的管理合伙人在移动互联网时代是非常有前瞻性的预言家。我们聊了很多关于MOE模型架构、金融领域特殊性以及AI应用生态的内容。对标上一代移动互联网的发展趋势,他告诉我未来需要走很长的路,要储备好自己的弹药、耐心以及预期,确保自己先上场,并一直留在场上。


之后我师姐把我介绍给了清华大学创新科技投资平台慕华科创,她刚好也是百川的首轮投资者,因此,慕华科创和百川决定共同投资我们。


其实我和川总也相识颇久。早在2012年左右,我还在清华大学读研究生时,他就在我们的人工智能实验室读博。后来,2013-2015年,加入搜狗后,他是我的第一个老板。当时我们团队在搜狗的创新项目心有灵犀(也就是后来的灵犀助手)做算法,连续两年都因为做出了巨大收入贡献,获得搜狗的CEO大奖。也因此,他对我印象非常深。


在基座层,我们并没有选择绑定任何一家基座模型,我们使用自有的业务数据微调了自己的模型。在应用侧,我们搭建了一个灵活的模型路由,用不同的大模型基座完成不同任务。


我们调用Baichuan4做数据结构化任务,调用智谱的All tools完成函数调用与观点打分类任务,调用Kimi完成长文本的专家观点总结类任务,调用deepseek完成长链路推理类任务。同时我们使用自有模型进行跨模型的协作与反思任务。阶跃的与财联社的合作场景,是我们对标benchmark之一。除此外,我们也会把很多深度分析任务交给claude 3.5完成,虽然它不如国产模型的价格便宜。至于大厂的一些产品,像千问我们会把它作为重要的开源补充项目。至于豆包,因为早期我们测过效果不太好,后来因为人手少,也没再去研究。


定义一个好的AI时代的投资工具


我们最想做的是帮z世代的年轻投资者重新定义一个专业且简单的投资工具。


洞察来自我们发现,很多传统的金融信息产品像同花顺、东方财富基本都是面向30-49岁的成熟投资者,而20-35岁的年轻投资者,信息交互方式已发生天翻地覆的变化,需求却没有被很好地满足。


我们就想能否做一个AI时代的投资领域的小红书,财搭子就是在这样的思考下诞生的。前一段我们一直在内测,来了数量远超预期的年轻用户。财搭子的交互形态类似小红书,以图文与轻社交为主,聚焦在投资信息和后信息的表达与交互上。


所谓信息一定要客观,不是主观小作文。后信息是说,过去资讯只是资讯,发布后是另一群人在点评。AI时代可以对实时新闻做解读,并将之和用户的关联统一表达出来。


大模型带来的很多变量,可以解决过去金融中的很多痛点,这也是让我最兴奋的地方。


一是它可以让专业简单化。传统意义上,专业的内容往往是复杂的,比如估值模型需要excel插件来实现,需要你懂dcf模型,需要一堆关键假设。而AI可以让用户只掌握几个简单的核心逻辑就够了。


二是可以让静态知识动态化。大模型深度推理能力与专家知识库思维链(CoT)能力的结合,可以让一个专家观点实时和一个具体的问题结合起来,让静态知识变成动态过程。所以你可以看到但斌或者巴菲特的历史思维链,从而将用户的持仓问题与专家的投资风格进行匹配与实时生产。


此外,AI也可以模拟专业投资者的思维方式,做可解释、可理解的推理。过去我们在做另类数据产品化过程中,通常只能将所有的文本数据进行情感打分,比如利空、中性、利空等,而AI可以对连续的文本以及多模态信息进行整体判断,这是过去做不到的。


这些变量足够对投资工具进行重新定义,而且会是大于现有市场十倍甚至百倍的机会。这里边很多改变是革命性的。像个人投资者,过去就是小散,支付了全市场的钱,却得到最少的信息,属于信息食物链的最底端。而一些大的机构,则通过支付高昂的费用,享受到很多买方分析师、卖方分析师等专家服务。而大模型让个人投资者用更低的价格,享受到原来封闭链条中的专家团队提供的知识服务,这也是一个专家知识的普惠化和平权化的过程。


每个人每天都应该有一个prompt(提示词)


这一代AI2.0跟之前一个非常大的区别就是个性化表达与个性化的任务处理。上代AI带来了推荐算法。这套算法里,就是人和信息这两个维度不停去做协同过滤。这个过程中,它是一个平台逻辑,为了优化人的信息的点击率和收入,提高平台效率,一个人是被符号化的,会被无数的tag和标签所代替。


我们的产品财搭子不做推荐平台,我们都围绕极致个性化。在传统的人与信息层面增加一个新的对齐维度,就是每个人当下的投资人设。它被具象成一个prompt,每个人都不一样,每天更新,提供一个人与信息的可解释性、可交互性和投资价值观的对齐。


原来的推荐,你不想看,只能点一个我不看了,这个过程中其实人很多时候是很无助的,但现在我们在人和信息中设置了抽象一层,相当于我能够把人和信息的表达可视化出来,而不仅仅是原来那些符号化的东西。


当然,极致个性化也会带来成本。每个人、每一天都要计算的话,对应的推理成本、能耗和时间都会巨大,就像李开复老师经常会提到的TC-PMF,是强调在开发和应用过程中必须综合考虑技术的可行性、成本可控性以及产品市场的契合度一样,我们也会做好平衡,在追求个性化的同时,追求极致工业化。


很多人会问,市面上很多传统的金融服务提供商,像同花顺有问财,wind有智能助理Alice,为什么还需要我们来做这件事?


我们的答案是这是一件属于颠覆的、AI原生应用来做的事。


很多传统公司要考虑短期投入ROI,需要对抗组织惯性。即便孵化一个新产品,也需要重新调整组织架构和客户架构,这都是风险很高的事,何况让用户对过去的传统产品改变心智,也是很难的一件事。所有的革新都需要新的组织形态,这也是我选择创业的原因。


做AI应用,很多人会担心随着模型能力的变化,很可能被大厂或者大模型公司狙击或者吞噬。但金融行业有很大的特殊性,对高质量的合成数据以及场景的奖励函数都有很高要求,这些都是底座大模型或大厂无法完成的。


另外,我们对于数据的积累、对于用户的理解都是独特的。用户在我们这里不断询问问题,或者观看、浏览或者留言,随着交互越来越多,我们会越来越了解他的个性。所以我们的壁垒是逐级构建的,也是不可被替代的。


这是未来十年我们最想做的一件事,尽管会很难,但还是希望我们构建的信息飞轮可以给Z时代的年轻投资者,在不确定的投资市场带来陪伴和确定性。


文章来自于微信公众号“暗涌Waves”,作者“于丽丽”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AIExcel公式

【开源免费】smart-excel-ai是一个输入你想要的Excel公式的描述,即可帮你生成对应公式的AI项目

项目地址:https://github.com/weijunext/smart-excel-ai

在线使用:https://www.smartexcel.cc/(付费)

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0