用最简单的方法来构建一个AI Web应用程序。
Gradio 5 来了!
刚刚,Gradio 官方表示经过几个月的努力,他们宣布 Gradio 5 稳定版本正式发布!
Gradio 是一个开源 Python 软件包,可让用户快速为机器学习模型、API 或任意 Python 函数构建 Demo 或 Web 应用程序。然后,用户可以使用 Gradio 的内置共享功能在几秒钟内通过公共链接分享 demo。无需 JavaScript、CSS 或 Web 托管经验!
更重要的是,只需几行 Python 代码即可完成上述演示。
这次开源的 Gradio 5 是由 Hugging Face 推出的,Hugging Face 于 2021 年收购了 Gradio 。据不完全统计,Gradio 每月拥有超过 200 万用户(在 Hugging Face Spaces 上有超过 47 万个应用),已成为构建、分享和使用机器学习应用的默认方式。
最新版本旨在弥补机器学习人员的专业知识和 Web 开发技能之间的差距。「机器学习开发人员对 Python 编程非常熟悉,但通常不太熟悉 Web 开发的具体细节,」Gradio 创始人 Abubakar Abid 表示。「Gradio 让开发人员只需几行 Python 代码即可构建高性能、可扩展的应用程序,这些应用程序是遵循安全性和可访问性方面的最佳实践。」
Gradio 5 最显著的特点之一是它注重企业级安全,Abid 也强调了这一点,他们还聘请了知名网络安全公司 Trail of Bits 对 Gradio 进行独立审计,并修复了他们在 Gradio 5 中发现的所有问题。对于 Gradio 开发人员来说,即使自己不是网络安全专家, Gradio 5 应用程序也是开箱即用,遵循网络安全方面的最佳实践。
不难看出,有了 Gradio 5,开发者可以构建生产级的机器学习 Web 应用程序,这些应用不仅性能优越、可扩展、设计精美、易于访问,而且还遵循了最佳的 Web 安全实践。
想要体验 Gradio 5 的小伙伴,只需在终端输入以下命令即可:
pip install --upgrade gradio
以下是 Gradio 5 中的 5 个新功能(包括一种无需编写代码即可构建 Gradio 应用的新方式!)
首先是加载速度。如果之前你使用过 Gradio ,给你的第一感觉可能就是加载过慢。现在 Gradio 5 有了重大的性能改进,包括通过服务器端渲染 (SSR) 提供应用程序,从而实现立即在浏览器中加载 Gradio ,不会再有加载时转圈圈的延迟。
其次是界面。此前,Gradio 应用看起来很老旧。现在 Gradio 5 更新了许多核心组件,包括按钮、选项卡、滑块以及高级聊天机器人界面。此外,官方还发布了一组新的内置主题,如「柑橘」和「海洋」主题,让用户轻松创建外观新颖的 Gradio 应用。
用户现在可以在 Gradio 中构建实时应用!Gradio 5 改变了流媒体的内部工作方式:现在使用 websockets 并通过 base64 编码发送数据,以减少延迟。Gradio 5 还通过自定义组件支持 WebRTC,并且还添加了更多文档和示例演示,这些文档和示例演示侧重于常见的流媒体用例,例如基于网络摄像头的对象检测、视频流、实时语音转录和生成以及对话聊天机器人。
安全性。Gradio 5 还在安全性方面做出了重大改进,包括获得 Gradio 的第三方审核。
LLM 的加持。Gradio 5 附带了一个实验性的 AI Playground,允许开发人员使用自然语言提示生成和预览 Gradio 应用程序。
Gradio 的一位负责人 Ahsen Khaliq 强调了此功能的重要性,他说:「与其他 AI 编程环境类似,用户可以输入文本提示,解释自己想要构建什么样的应用程序,然后 LLM 会将其转换为 Gradio 代码。但与其他编码环境不同的是,用户还可以查看 Gradio 应用程序的即时预览并在浏览器中运行它。」
AI Playground 链接:https://www.gradio.app/playground
可以看出,随着人工智能继续影响各个行业,像 Gradio 5 这样将先进技术与实际业务应用相结合的工具可能会发挥重要作用。通过此版本,Hugging Face 不仅仅是更新了产品,它可能会改变企业人工智能开发的格局。
参考链接:
https://x.com/Gradio/status/1844142446185414718
https://venturebeat.com/ai/gradio-5-is-here-hugging-faces-newest-tool-simplifies-building-ai-powered-web-apps/
文章来自于微信公众号“机器之心”
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】Whisper是由openai出品的语音转录大模型,它可以应用在会议记录,视频字幕生成,采访内容整理,语音笔记转文字等各种需要将声音转出文字等场景中。
项目地址:https://github.com/openai/whisper
在线使用:https://huggingface.co/spaces/sanchit-gandhi/whisper-jax
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales