大模型没有免费午餐
大模型没有免费午餐618卷进大模型,谁是真正的赢家
618卷进大模型,谁是真正的赢家
来自美国小城博尔德的两位高中生,为他们的初创公司APIGen筹集了50万美元种子轮投资。这两个18岁的年轻人用他们所能链接到的一切资源主动「破壁」,最终凭借深刻见解让VC感到惊艳,主动提出投资。
是时候把数据Scale Down了!Llama 3揭示了这个可怕的事实:数据量从2T增加到15T,就能大力出奇迹,所以要想要有GPT-3到GPT-4的提升,下一代模型至少还要150T的数据。好在,最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了,但你有卡吗?
或许是个朱啸虎看好的项目。 根据外媒消息,成立不到1年的日本人工智能初创公司SakanaAI,即将斩获超1亿美元融资,估值飚至1800亿日元(约合人民币82亿,11.5亿美元),即将跻身AI独角兽行列。
80%收入来自海外,酒旅服务软件出海。
WWDC上展示的苹果AI能力,在秋季iOS 18推出之后,很难用得上了。最新报道称,集成强大Siri的苹果AI将在今年晚些时候推出,而且苹果正设计一款更轻薄的iPhone,预计在2025年上线。
GTP-4o挑战悬赏八百万的超难数据集,实现SOTA!
只要1/200的参数,就能让大模型拥有和GPT-4一样的数学能力? 来自复旦和上海AI实验室的研究团队,刚刚研发出了具有超强数学能力的模型。 它以Llama 3为基础,参数量只有8B,却在奥赛级别的题目上取得了比肩GPT-4的准确率。
大语言模型(LLM)的迅速发展,引发了关于如何评估其公平性和可靠性的热议。
通过算法层面的创新,未来大语言模型做数学题的水平会不断地提高。