AI TNT— 让一部分先用AI实现商业化

如何无痛玩转Llama 3，这个手把手教程一看就会！80亿参数推理单卡半分钟速成，微调700亿参数仅用4卡近半小时训完，还有100元代金券免费薅。

来自主题: AI资讯

7872 点击 2024-06-26 18:18

24点游戏、几何图形、一步将死问题，这些推理密集型任务，难倒了一片大模型，怎么破？北大、UC伯克利、斯坦福研究者最近提出了一种全新的BoT方法，用思维模板大幅增强了推理性能。而Llama3-8B在BoT的加持下，竟多次超越Llama3-70B！

来自主题: AI技术研报

8062 点击 2024-06-08 20:15

一夜之间，全球最强开源模型再次易主。万众瞩目的Qwen2-72B一出世，火速杀进开源LLM排行榜第一，美国最强开源模型Llama3-70B直接被碾压！全球开发者粉丝狂欢：果然没白等。

来自主题: AI技术研报

8051 点击 2024-06-08 11:44

最新版本大模型，6 分钱 100 万 Token。

来自主题: AI资讯

6434 点击 2024-06-05 22:42

去年10月，硅谷VC巨头Vinod Khosla曾在X发文，“忧心忡忡”地称美国的开源大模型都会被中国抄去。万万没想到，8个多月过去，射出的回旋镖最终扎回了自己的心。

来自主题: AI资讯

8793 点击 2024-06-05 10:39

抄袭框架和预训练数据的情况，是更狭义的套壳。

来自主题: AI资讯

7817 点击 2024-06-05 09:56

斯坦福团队抄袭清华系大模型事件后续来了—— Llama3-V团队承认抄袭，其中两位来自斯坦福的本科生还跟另一位作者切割了。

来自主题: AI资讯

8049 点击 2024-06-04 16:05

每个token只需要5.28%的算力，精度就能全面对标Llama 3。

来自主题: AI技术研报

8958 点击 2024-05-30 15:51

把大模型塞进手机里需要几步？

来自主题: AI资讯

7854 点击 2024-05-21 09:27

杀疯了！一夜之间，全球最强端侧多模态模型再次刷新，仅用8B参数，击败了多模态巨无霸Gemini Pro、GPT-4V。而且，其OCR长难图识别刷新SOTA，图像编码速度暴涨150倍。这是国产头部大模型公司献给开发者们最浪漫的520礼物。

来自主题: AI资讯

8950 点击 2024-05-20 15:54