
速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题
速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎,致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。
一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎,致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。
如果你是一名正在投身 AI 浪潮的创业者,或者一个正在思考,如何利用 AI 改造现有业务的从业者,那么 G7 易流 CEO 翟学魂的经历,或许能给你带来一些重要的启示。
前几天发现一个有意思的应用 Macaron,靠颜值就吸引了我,整个设计风格非常的阳光而且高级,尤其是里面的图标,很好看。
今年 6 月,The Browser Company 向 Arc 用户开放了浏览器 Dia 的 Beta 测试。上个月,Perplexity 新推出了自己的 AI 原生浏览器 Comet,随后 OpenAI 也宣布计划在未来几周发布浏览器。
AI领域一度陷入“上下文窗口”的军备竞赛,从几千token扩展到数百万token。这相当于给了AI一个巨大的图书馆。但这些“百万上下文”的顶级模型,它究竟是真的“理解”了,还是只是一个更会“背书”的复读机?
“一句话做应用”,虽说这个概念已经并不新鲜。但说实话,市面上能真正达到交付标准的产品寥寥无几。
AI生成论文泛滥成灾,arXiv平台看不下去了—— 紧急升级审核机制,用自动化工具来检测AI生成内容。 Nature最新发现,原来每年竟然都有2%的论文会因为AI使用被拒?! 比如像,bioRxiv和medRxiv每天都要拒绝十多篇公式化AI手稿,每个月就高达7000多份。
谷歌开源Gemma 3 270M闪亮登场!只需几分钟即可完成微调,指令遵循和文本结构化能力更是惊艳,性能超越Qwen 2.5同级模型。
前沿 AI 模型真的能做到博士级推理吗? 前段时间,谷歌、OpenAI 的模型都在数学奥林匹克(IMO)水平测试中达到了金牌水准,这样的表现让人很容易联想到 LLM 是不是已经具备了解决博士级科研难题的推理能力?
无需人工标注,吞下17亿张图片,Meta用自监督学习炼出「视觉全能王」!NASA已将它送上火星,医疗、卫星、自动驾驶领域集体沸腾。
首个开源多模态Deep Research Agent来了。整合了网页浏览、图像搜索、代码解释器、内部 OCR 等多种工具,通过全自动流程生成高质量推理轨迹,并用冷启动微调和强化学习优化决策,使模型在任务中能自主选择合适的工具组合和推理路径。
加拿大AI新贵Cohere获5亿美元融资、估值68亿美元,前Meta FAIR副总裁、PyTorch与Llama重要推手Joelle Pineau加盟出任首席AI官,或将开启企业AI新战局。
随手拍的一张图,就能秒变3A级游戏大作?! 刚刚,腾讯全新开源游戏视频生成框架Hunyuan-GameCraft,专为游戏环境设计,让任何人都能轻松搞定游戏制作。
10亿用户App转向AI原生应用,大船如何掉头?高德最近打了个样,用AI重构底层技术栈,建立主-从Agent架构,将千问大模型与空间智能结合,展现出了新范式的强大威力,给用户带去了极大便利。
给 Sam 的专业建议:直播选人要小心。 大家都是老朋友,在新 Lab 聚首了。
GPT-5发布以来,路由架构是最受关心的部分之一。它不仅实现了多个模型统一调度,而且还藏着奥特曼的诸多小心思。比如成本更可控、悄悄识别意图插入广告等。
短短两个月前,我们还在感叹 31 家 AI 小团队的高效表现,当时团队平均规模仅 20 人,人均创造收入高达 279 万美元(参见《细数 31 家 AI 应用小团队,平均 20 人、人均创收 279 万美元》)。
疯狂的七月已经落下了帷幕,如果用一个词来形容国产大模型,「开源」无疑是当之无愧的高频词汇。
当大模型在代码世界封神时,一场硬件领域的新战役也在打响——如何让 AI 在物理世界「动手」。这场攻坚战的突破速度比预想快一些,Physical AI 的可行性轮廓已然变得更为清晰。
和马斯克一起创业的人到现在已经离开了四分之一。 2023 年 7 月 12 日,马斯克和其余 11 位联合创始人宣布成立了 xAI,带着「理解宇宙」的使命强势进军 AI 行业。
我们越来越接近AGI——至少看起来是这样。时间表从50年压缩到5年,更有大佬预测2026、2028年。可与此同时,AI在ARC测试的得分却是0%,在人类基本能力上依然像个新手。我们是不是太早以为,它已经准备好了?
服装视频广告太烧钱?卡点变装太难拍? 字节跳动智能创作团队联合清华大学最新推出一款全能的视频换装模型 DreamVVT,为视频虚拟试穿领域带来了突破性进展。
在OpenAI内部,有一个被称为北极星的梦想:让AI成为陪伴每个人一生的良师益友,从而实现真正的教育公平。OpenAI将ChatGPT视为一个致力于弥合教育鸿沟、赋能全球6亿用户的学习平台。
OpenAI 在 AI 领域引领了一波又一波浪潮,想必很多人好奇,这些创新背后的研究人员是如何通过面试的? 尤其是现在,OpenAI 已经成为全球最受瞩目的 AI 公司之一,吸引了无数顶尖人才投递简历。想要加入这个团队,着实不容易。
思维链 (CoT) 提示技术常被认为是让大模型分步思考的关键手段,通过在输入中加入「Let’s think step by step」等提示,模型会生成类似人类的中间推理步骤,显著提升复杂任务的表现。然而,这些流畅的推理链条是否真的反映了模型的推理能力?
GPT-5一上线,用户瞬间破防——太冷漠,太爹味,还我GPT-4o!就在刚刚,奥特曼彻底滑跪了,宣布GPT-4o满血复活,重回默认模型宝座。从曾经的遭人唾弃,到今日的白月光回归,ChatGPT的用户们给奥特曼结结实实上了一课。
印度音频连续剧平台Pocket FM 致力于成为音频界的 Netflix。该公司计划根据用户喜好,为其匹配拥有数百集内容的音频剧集。为实现这一目标,平台需要快速发布内容——这正是其目前借助 AI 技术发力的方向。
在生成式 AI 时代,全球数据总量正以惊人速度增长,据 IDC 预测,2025 年将突破 180ZB,其中 80% 为非结构化内容,传统数据分析在应对多模态信息和打破结构化数据技术壁垒方面尽显乏力,“人工找数 + 手动分析” 的模式严重抑制甚至沉没了数据价值。
Anthropic 已收购 Humanloop 的联合创始人和大部分团队成员,该公司是一个专注于提示管理、LLM 评估和可观测性的平台,此举旨在强化其企业战略。
量子计算领域新里程碑,刷新世界纪录! 潘建伟团队利用AI技术,在60毫秒内成功构建多达2024个原子的无缺陷二维和三维原子阵列,刷新了中性原子体系无缺陷原子阵列规模的世界纪录。