AI时代的北大声音!北大126周年校庆500余校友共谋「人工智能+」
AI时代的北大声音!北大126周年校庆500余校友共谋「人工智能+」2024年5月3日下午,北大建校126周年校庆之际,在北大博雅酒店的聚光灯下,一场汇聚顶尖AI智慧的盛宴——北京大学人工智能产业峰会暨校友「人工智能+」论坛在北大校庆期间隆重举行。
2024年5月3日下午,北大建校126周年校庆之际,在北大博雅酒店的聚光灯下,一场汇聚顶尖AI智慧的盛宴——北京大学人工智能产业峰会暨校友「人工智能+」论坛在北大校庆期间隆重举行。
今年 1 月份,2024 年度 IEEE 冯诺伊曼奖项结果正式公布,斯坦福大学语言学和计算机科学教授、AI 学者克里斯托弗・曼宁(Christopher Manning)获奖。
近年来,大型语言模型(LLM)在数学应用题和数学定理证明等任务中取得了长足的进步。数学推理需要严格的、形式化的多步推理过程,因此是 LLMs 推理能力进步的关键里程碑, 但仍然面临着重要的挑战。
万万没想到,与任务无直接关联的多模态数据也能提升Transformer模型性能。
传统的 3D 重建算法需要不同视角拍摄的多张图片作为输入从而重建出 3D 场景。近年来,有相当多的工作尝试从单张图片构建 3D 场景。然而,绝大多数此类工作都依赖生成式模型(如 Stable Diffusion),换句话说,此类工作仍然需要通过预训练的生成式模型推理场景中的 3D 信息。
当前最火的大模型,竟然三分之二都存在过拟合问题?
答案揭晓了! 「神秘gpt2-chatbot不是GPT-4.5」。
2024 年 4 月 20 日,即 Meta 开源 Llama 3 的隔天,初创公司 Groq 宣布其 LPU 推理引擎已部署 Llama 3 的 8B 和 70B 版本,每秒可输出token输提升至800。
自2021年诞生,CLIP已在计算机视觉识别系统和生成模型上得到了广泛的应用和巨大的成功。我们相信CLIP的创新和成功来自其高质量数据(WIT400M),而非模型或者损失函数本身。虽然3年来CLIP有大量的后续研究,但并未有研究通过对CLIP进行严格的消融实验来了解数据、模型和训练的关系。
一种全新的神经网络架构KAN,诞生了! 与传统的MLP架构截然不同,且能用更少的参数在数学、物理问题上取得更高精度。