神经网络就像是一个强大的虚拟大脑,它可以解决许多类型的问题。这篇文章里,作者就总结了神经网络的概念、技术基本实现原理、应用场景与产品案例等方面的内容,一起来看看,或许会对AI产品经理们有所帮助。
各位看官:
上一篇文章我们提到了AI中的监督学习,监督学习属于机器学习中的一种范式,计算机通过提供已知输入和对应输出的训练数据,学习输入与输出之间的映射关系,以便在面对新的未知输入时能够做出准确的预测。如果想了解监督学习的更多内容,可以翻阅我之前写的一篇《产品经理的独门技能—AI监督学习(6000字干货)》
在AI人工智能的机器学习中,不仅有监督学习,还有神经网络。神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,它就像一个强大的虚拟大脑,能够学习、处理信息,解决各种问题,今天我们就来讨论一下神经网络。
本篇会先介绍一下神经网络的基本概念,神经网络是如何传递信息的。然后,从神经网络的3大优势出发,强大的学习能力、广泛的通用性,高效地端到端学习,展开说说为啥神经网络这么火。
说完神经网络的概念和优势之后,我会进一步说明神经网络的技术基本实现原理。从神经元,层次结构,权重,激活函数这四点入门,来揭开神经网络的“盖头”,看其庐山真面目。
接下来,基于神经网络,顺带引出它的高级版本:深度学习,浅聊一下他们之间的关系。后期会有专门的篇章来介绍深度学习,就不在此处展开,本篇重点还是围绕神经网络。
在第五节,会介绍神经网络在金融、医疗、电商三大应用场景之下,提供智能风控,智能诊断,个性化推荐等解决方案。
最后,带着大家简单体验一款在神经网络技术上实现落地的产品,网易有道翻译。它通过自主研发的神经网络技术,实现了更准确、更自然的翻译效果,为用户提供了全新的语言交流体验。
网易有道翻译从翻译这个非常细分垂直,但是又如此普及大众的使用场景出发,我们不仅看到了神经网络翻译技术的应用,更见证了它在实际场景中的亮点。我们正身处AI变革的时代,神经网络不再是遥不可及的未来科技,它已经深入到我们生活的方方面面,成为推动整体行业进步的强大引擎。
(附图:本篇文章结构导图,方便大家在阅读前总揽全局,有大致的画面框架)
神经网络这个词,听起来很玄乎又高深,我刚开始知道的时候,也是感觉自己知晓了什么神秘魔法似的,AI里面还有神经网络这么厉害的学问啊,但当我深入了解之后,发现其真相也没有我想象的那么深奥难懂。
神经网络灵感来源于人脑的神经系统,是一种模仿人脑神经系统结构和功能的计算模型,模拟了人脑神经元之间的连接和信息传递,通过训练数据来学习复杂的模式和关系。
神经网络有很多层,它们通过层层的神经元连接构建模型,连接传递信息,用于解决各种复杂的问题,如图像识别、语音识别、自然语言处理等。
那么,神经网络是如何传递信息的呢?
在神经网络之中,每个神经元都有输入和输出,它接收一些输入,通过权重和激活函数的作用,产生一个输出。这个输出可以作为其他神经元的输入,从而形成神经元之间的连接。
这些连接的权重决定了信息在网络中传播的强度,而激活函数则决定了神经元是否应该被激活并传递信息。通过调整神经元之间连接的权重,神经网络可以学习并适应输入数据的模式,在大量数据中找到规律,从而在学习后提供更为准确和有效的输出。
神经网络分为不同层次,包括输入层、隐藏层和输出层。输入层接收原始数据,输出层产生模型的预测或结果,而隐藏层则在这两者之间进行信息处理和学习。
关于神经元,权重,激活函数和神经网络的层次结构,我会在第三节单独展开说说,毕竟这部分是神经网络可以如此厉害的“秘密武器”。
神经网络像是学霸,像是全能高手,简直就是一名六边形战士,其实,神经网络这么牛也是有原因的。我将从神经网络的优势出发,讲述其强大的学习能力、广泛的通用性、端到端学习的高效性,用尽可能通俗易懂的语言呈现神经网络的亮点优势。
神经网络的学习能力很强,神经网络在处理大规模、高维度数据时表现出色,它能够从海量数据中学习复杂的模式和特征,大数据就是它爱吃的一道主菜。
AlphaGo就是一个典型例子,AlphaGo通过大量棋局数据进行训练,利用神经网络学会了高级的围棋策略。在2016年,AlphaGo以4比1战胜了世界冠军李世石,展示了神经网络在复杂智力游戏中的非凡学习能力。
神经网络不受限于特定领域,具有广泛的通用性,在各领域都能发挥其本领。无论是图像识别、语音处理还是自然语言处理,神经网络都能够处理各种类型的数据。这种通用性使得神经网络成为解决多领域问题的通用工具。有一说一,这在哪里都“吃得开”的优势,着实令人佩服。
例如,在图像识别领域,基于卷积神经网络(CNN)的图像分类模型,能够在海量图像中准确识别出不同物体。这项技术在人脸识别、医学影像分析等方面都带来了巨大便利。
当我们用传统方法解决问题时,通常需要多个步骤,比如先处理原始数据、提取特征,然后再应用模型进行预测,最后根据预测输出结果。
神经网络支持端到端学习,这是一种更简化的方法,它让神经网络直接从原始数据到最终输出进行学习,省略了中间许多繁琐的步骤,无需人为干预。
这种高效性不仅简化了问题的处理流程,也减轻了人工干预的负担,使得神经网络在处理实际问题时更为高效。
相信大家对语音识别已经不陌生了,神经网络的端到端学习为语音识别模型的发展带来了重大突破。通过神经网络,系统能够直接从声波信号中学习到语音的表示,避免了过程中复杂的特征工程,比如语音信号的预处理、特征提取、声学建模、语言模型等。
端到端学习通过使用神经网络,将整个语音识别过程作为一个端到端的模型进行训练,将输入的声音波形映射到相应的文本输出,直接完成语音到文本的转换。这不仅降低了对专业知识和人工干预的需求,而且提高了语音识别系统的性能和适应性。
从以上三大优势可以发现,神经网络有强大的学习能力,又不挑食,什么领域都能搞定,还能自动化解决问题,又聪明又省心,试问谁不爱呢?也难怪神经网络这么受人欢迎了。
既然神经网络这么厉害,那我们就不得不去揭秘一下其背后的技术原理啦。照惯例,我们浅浅涉入一下基本原理即可,太深入的话,大脑CPU会烧坏的吧,哈哈。
神经网络听起来高大上,其实它的实现原理并不复杂。我们可以从神经元、层次结构、权重和激活函数等方面来看。这部分呼应了第一节的概念说明,之所以单拎一节展开详解,是为了能重点说清楚其工作原理,有基础的同学可以浅看一下或顺便路过哦。
神经网络中的基本单元是神经元,这个概念是受到生物学启发的,就像大脑中的神经元一样。每个神经元接收一些输入,通过一定的权重进行加权,然后通过激活函数产生输出,这个输出会传递到下一层的神经元,形成信息的传递链。
神经元的工作原理分四步:接收信息,信息加权,整合与决策、传递信息。
【接收信息】:想象一下神经元就像是一个小小的信息接收器,它从其他神经元或外部输入接收信息,就像你大脑中的神经元通过神经突触传递信号一样。
【信息加权】:接收到的信息并不是平等的,每个输入都有一个权重。权重就像信息的重要性标志,有些信息可能对神经元的决策更有影响。就像我们日常处理事务时,会考虑轻重缓急,重要紧急的事情相较于不重要不紧急的事情,权重会高很多。
【整合与决策】:神经元会将加权的信息汇总,并通过一个激活函数来做出决策。这个激活函数就像是神经元的思考过程,它决定了神经元是否“激活”(发出信号)或“不激活”(保持静默)。
【传递信息】:如果神经元激活了,它会向连接的其他神经元传递信息,就像一个信息传递者。这样,信息就可以在神经网络中流动,实现复杂的任务和学习过程。
比方说,你可以将神经元想象成一个小秘书。她接收来自不同同事的信息,对每个同事的话分配不同的重要性(权重),最后整合这些信息并作出决策。如果决策是积极的,她就会把相关信息传递给其他同事。这样,整个办公室中的信息可以有效地传递和处理,就像神经元在神经网络中的作用一样。
神经网络通常有多层,分为输入层、隐藏层和输出层。输入层接收外部输入,比如图像的像素值。隐藏层对输入进行处理,提取特征。输出层产生最终的结果。每个层都有很多神经元,形成了一个层次化的结构。
如果把神经网络比作一家有分层管理的公司结构,其工作原理就是这样的。
【输入层】:假设有一家公司的员工小A,他工作是收集客户的信息,这些信息就像是公司的输入,而小A就处在神经网络中的输入层。在这一层,信息通过各种通道(特征)进入系统。
【隐藏层】:通常情况下,公司的管理层会有多个负责处理不同任务的团队。每个团队都负责公司内部的一部分处理工作,但他们的工作对外部来说是不可见的。这就像神经网络中的隐藏层,它在内部处理信息,执行各种复杂的计算,对外也是不可见的。
【输出层】:公司最终需要将处理过的信息呈现出来,这就是输出。管理层的决策通过“输出层”来完成,就像神经网络中的输出层将结果信息传递出来一样。
同理,如果把神经网络的层次结构比作是电商平台。输入层就像是收集了用户的浏览、购买等信息,隐藏层就像是进行了各种复杂的推荐算法和分析,最后输出层将推荐的商品呈现给用户。
总之,神经网络的这种分层结构,有助于更有效地处理和理解复杂的信息。
权重是神经网络中非常关键的参数,每个连接都有一个权重,这个权重代表了网络中连接的强度,而强度决定了信号在网络中传递的影响程度。在训练过程中,神经网络会通过学习调整这些权重,使其能更好地适应任务。
打个比方,作为一名咖啡深度用户,每天一杯咖啡代表了一天工作的开始,我就以制作一款咖啡来比喻,说一下权重是如何发挥作用的。
如果我们想调制出一款符合自己口味的咖啡,配方中咖啡豆、牛奶和糖的比例,就像神经网络中的不同的连接权重,决定了每个成分对最终咖啡味道的影响程度。
发现咖啡的味道不够浓郁,可能会增加咖啡豆的比例,就像在神经网络中增加“咖啡”连接的权重,这会使咖啡豆的影响更大,整体咖啡更浓。反之,如果咖啡太苦,我们可能会减少咖啡豆的比例,减轻其影响,就像在神经网络中减小“咖啡”连接权重。同理,如果喜欢甜一点,就会增加糖的比例,那么神经网络中“糖”连接的权重就会变大,反之亦然。
以调制咖啡为例,权重就是调整不同成分比例的关键。我们通过调整每个成分的比例,实现了咖啡味道的优化,冲泡出了一杯自己喜欢的咖啡。同样,神经网络通过调整连接权重,根据输入数据的影响程度,优化模型对不同输入的响应,适应不同的任务和数据,实现丰富的学习和预测功能。
激活函数是神经元内部的一种数学操作,类似于人脑中神经元的激活过程。激活函数接收神经元的输入,通过一些数学运算(通常是非线性的)得出一个输出。这个输出将决定神经元是否激活,并将信息传递给网络的下一层。简单来说,它决定了神经元是否应该“激活”并传递信息给其他神经元。
如果没有激活函数,神经网络的每一层都只能执行线性变换,多层的线性叠加依然只会得到线性关系。激活函数的引入使得神经网络能够学习和表示更为复杂、非线性的模式和关系。
(也许有人对线性、非线性不太理解,我这里插播说明一下,如果你已知,可以直接略过)
在数学上,线性函数关系是可以用直线来表示,而非线性函数关系往往是非直线的,包括各种曲线、折线、不连续的线等。在线性关系中,一个变量的变化与另一个变量成正比例关系或反比例关系,而在非线性关系中,一个变量的变化不一定导致另一个变量的等比例变化。
在数学公式中,y=mx+b,就是线性关系。这种形式的关系图像在坐标系中是一条直线。
同样是数学公式,幂函数就是非线性关系。其关系图像在坐标系中是一段曲线。(插播结束)
我们来举个例子,便于理解激活函数的作用。
假设,如果要开发一款识别猫狗的AI工具,在神经网络中,就需要有一个神经元专门负责识别猫耳朵的轮廓,激活函数就像是这个神经元内部的决策者,如果图像中有猫耳朵的形状,激活函数就会打开这个“开关”,让信息传递到下一层,表示网络认为图像中可能存在猫。如果没有猫耳朵的形状,这个“开关”就关闭,信息不传递,表示网络认为图像中可能不存在猫。
所以,激活函数的作用就是通过这种开关的机制,让神经网络能够更智能地处理各种输入,做出符合任务要求的决策。比如,几秒钟就成功识别出上千万张图中是猫还是狗。
深度学习专注于使用深层神经网络来解决复杂的问题。深度学习的“深度”指的是神经网络的层数,通常包含很多层,使得模型能够学到更加抽象和复杂的特征。深度学习的核心思想是通过多层次的非线性变换来提取数据的高级表示,从而实现更精确的预测和决策。
想象一下,浅层神经网络就像是简单的任务处理者,而深层神经网络则是一个层层递进、能够理解更复杂信息的学习者。这种层次结构使得深度学习在处理大规模数据和复杂任务时表现更出色。
我们依旧以计算机识别猫和狗的图片为例。
在深度学习中,我们会构建一个深层神经网络,这个网络就像是一堆图层叠在一起的学习器,每一层负责学习不同层次的特征,比如底层学习猫狗皮毛纹理、中层学习猫狗形状、高层学习猫狗整体的样子。通过反复调整网络中的权重和参数,计算机能够逐渐学到猫和狗的区别,最终达到能够准确识别的程度。
简单来说,神经网络是一种计算模型,而深度学习是使用深层神经网络进行机器学习的方法。神经网络是深度学习的基础,而深度学习则是神经网络发展的一种更高级、更复杂的形式。
最近几年,神经网络就像潮流中的明星一样,各个领域都纷纷圈粉。接下来,我们可以看看这位“明星”在不同应用场景中,分别做出了什么业绩。
在金融行业,神经网络被广泛应用于风险管理和欺诈检测。根据FTC(美国联邦贸易委员会)的数据,2021年消费者报告的欺诈损失超过58亿美元,比2020年增长了70%以上。
谁都不希望自己辛辛苦苦赚到的钱,因为一次网络欺诈全打了水漂,可怕的是,只要我们通过网络进行支付交易,都会面临这个风险,所以反欺诈真的是非常重要。通过深度学习,神经网络可以分析大量的交易数据和用户行为,识别潜在的风险和异常情况,保障金融系统的安全性。
高级授权(VAA)评分服务是Visa公司的反欺诈产品之一,VAA使用人工智能来评估正在进行的交易是否存在欺诈的可能性,可在300毫秒内完成交易的欺诈检测,几乎不会影响客户和商家的在线实时交易,神经网络在其中起到了重要作用。
根据Visa的报告,从2020年10月到2021年9月,Visa处理了2325亿笔支付交易。仅在2021年,VAA就在其网络上识别并防止了260亿美元的欺诈行为。
随着我们越来越多的财务生活存在于“云”中,真心的希望强大的人工智能可以保护好我们每一位老百姓的辛苦血汗钱。
神经网络在医疗领域的应用为疾病诊断提供了新的思路。通过深度学习,神经网络可以分析医学影像,辅助医生更准确地诊断病症。例如,在乳腺癌检测中,神经网络可以识别微小的肿块,提高了检测的灵敏度。
IBM的Watson for Oncology利用神经网络,帮助医生制定个性化的癌症治疗方案,根据大量医学文献和病例数据,提供更精准的医疗建议。WFO通过从病历中获取有价值的信息,为癌症患者提供合理的个体化治疗方案。
WFO于2016年首次正式登陆中国,湘雅二医院肿瘤中心就WFO在宫颈癌的治疗帮助上进行了研究。宫颈癌是女性生殖道常见的恶性肿瘤,其发病率在全世界女性中仅次于乳腺癌,是威胁女性健康和生命的第二大癌症。
在 300 名宫颈癌患者中,有 246 名患者符合 WFO 分析的条件。在246名患者中,有179名患者的宫颈癌病例,WFO 治疗方案与实际临床实践总体一致,这个占比达到了72.8%。
有了神经网络的助攻,AI医疗可以让越来越多的人因此受益,癌症也将变得不再可怕。
在个性化推荐系统中,系统收集用户的行为数据,包括点击历史浏览、购买记录、搜索记录等,这些数据构成神经网络的训练集,用于学习用户的行为模式。
接下来,神经网络将用户的行为数据转化为可理解的特征表示,并进行学习和训练。
然后,根据用户的实际反馈(点击、购买等),系统不断更新神经网络的参数,对用户的未知行为进行预测,以提高推荐的准确性和个性化程度。
亚马逊(AWS)的推荐系统就利用神经网络进行深度学习,对大量用户数据进行分析和学习。其推荐系统每天能够处理数十亿条数据,包括用户的点击、购买、收藏等多方面的行为,以确保推荐的准确性。
根据麦肯锡的报告,亚马逊有超过 35% 的销售额来自于系统的推荐,AWS呈现在不同用户面前的就是不同的商品页面,也就是我们俗称的“千人千面”。
神经网络翻译( Neural Machine Translation,以下简称NMT)是一种基于深度学习的机器翻译方法,通过模拟人脑神经元的工作原理,实现对输入语言到输出语言的端到端学习。
神经网络翻译是神经网络在机器翻译领域的应用,神经网络使得神经网络翻译在处理大规模语料库时能够学到更复杂的语言规律和语境信息,实现准确的自动翻译。
相较于传统的机器翻译方法,NMT更注重上下文的理解,能够更好地处理句子的结构和语境,使得翻译结果更为自然流畅。
早在2017年4月,网易有道就对外公布称,由网易公司自主研发的神经网络翻译技术(YNMT)正式上线。到了2018年,网易有道进一步采用Transformer作为基础架构,研发出更高效的翻译系统。
有道旗下的翻译产品——网易有道翻译,就是基于有道神经网络翻译提供文本翻译、图片翻译、文档翻译、网页翻译等各种场景的翻译服务。这帮助我们在跨国交流中,即使不懂对方国家的语言,也可以满足一些基本交流,至少在全球旅游的这个梦想下,语言障碍已经不会排在第一位了。
相信有外语翻译需求的朋友,对网易有道翻译这款产品并不陌生,有时候因为工作或生活的需要,我们会浏览到国外的网站,不仅是英文,也许我们还会浏览到日文、俄文的或者是其他语言的网站。所以,相对准确又快速的翻译,就显得尤为重要。
有了YNMT有道神经网络翻译技术作为基础,网易有道翻译这款产品的翻译能力几乎可以对标一名有专八水平的大学生,除了能支持109种语言互译,还能提供42个专业术语库或上传自定义术语库。用大白话来说,就是懂行,翻译出的内容符合行业术语要求,也符合专业场景下的语境要求。
目前能直观地看到,官方推荐的术语库就有材料科学、测绘科学技术、地球科学、电子、通信与自动控制技术、动力与电气工程、法学、纺织科学技术、管理学、航空、航天科学技术、化学、环境科学技术、机械工程、计算机科学技术、交通运输工程等等。
同时,我们在翻译时,还可以根据具体的使用场景,比如医学、计算机、金融经济,提供更符合语境的翻译结果。
就在今年的4月份,网易有道翻译升级至最新的V10.0.0版本,覆盖10种翻译场景,包含文本、文档、图片、音频、视频、同传翻译等,支持10种文档格式,已开放每年240万免费翻译字符,虽然部分功能需要付费使用,比如音频翻译和同传翻译只能免费试用20分钟,AI BOX智能润色功能(支持句子、段落润色,文章纠错)也只能免费试用10次,但如果是基本翻译需求,也已经够用了。
当我们在知晓神经网络的原理之后,基于一定的AI知识储备去体验一款真实的产品,就像在知道魔术原理的背景下去看一场魔术表演,其中神奇又玄幻的部分,就不会觉得那么神秘了。
从网易有道翻译这款产品出发,我们能看到神经网络翻译技术的特点。
【多语言支持】:网易有道翻译借助神经网络翻译技术,实现了对多语言的支持,支持109种语言互译,可以说几乎满足了全球各个国家的语言沟通。
【上下文理解】:神经网络翻译技术通过深度学习模型对大量语料进行训练,能够更好地理解句子的上下文关系。
这种能力使得翻译系统能更好地把握文章或对话的整体语境,产生更连贯、自然的翻译结果,让用户获得更符合实际语言使用情境的译文,而不是简单地对独立的句子进行翻译。
【专业词汇处理】:通过深度学习,网易有道翻译产品可以处理各行业专业术语,翻译的结果也会更精准、可靠。
比如支持材料科学、测绘科学技术、地球科学、动力与电气工程、管理学、航空、航天科学技术等等术语库。
【用户体验更棒】:神经网络翻译技术在保持高准确性的同时,模型也强调翻译的自然度,使得译文更贴近人类语言表达习惯,为用户提供更流畅、易懂的翻译体验。
有道AIBox(beta版)就在这个点上进行发力,YNMT模型支持的个性化体验可以提供更符合用户口感的翻译结果,提高语言使用的舒适度,AI润色后的翻译内容更懂人性。
网易有道翻译网页版有新出一款新版的AI 翻译,提供母语级高精AI翻译,并支持继续润色及语法分析等功能。
中华文化博大精深,既然适合咱们中文母语,不知道翻译一首李白的《将进酒》,效果如何?
于是,我将诗句输入文本框,点击“AI翻译”,等待了几秒的“文本生成中”,它给了我一段译文,译文如图,大家觉得翻译效果如何哈?
如果我试着将这段英文,再让AI翻译成中文,并且要求AI润色一下,会是什么结果呢?带着好奇心,我将AI翻译好的英文复制进了文本框,再次点击AI翻译后,看到了英译中的结果。
如图可见,从语言的对仗、韵律、文字修辞,用词精准达意,情感抒发等各方面看,还是咱李白的原诗更胜一筹哈。
接下来,我选择了AI润色,既然是一首诗,试试将句子润色得更华丽,AI会给我什么结果呢?选择“句子润色-更华丽”,我看到了如图回复,不知道看到此处的你,有什么新的灵感呢?
感受一下带着文学才气的AI翻译之后, 再体验一把论文翻译的功能,arXiv论文翻译功能支持arXiv论文摘要页面链接、arXiv论文pdf下载链接、论文其他格式源下载链接或使用chrome打开的论文pdf链接。从结果看,翻译内容还是不错的。从体验看,双语对照还是很贴心的。
其实,无论是多国语言翻译,多场景翻译,多术语库支持,还是AI翻译,网页翻译,论文翻译等等。底层都是基于神经网络翻译技术来实现的,它就在我们接触的AI产品的界面背后,我们看不到、摸不着,却又在每一次触发翻译时,都需要调用它。
未来,神经网络翻译将更注重实时交互翻译的能力。在翻译领域,我们可以期待更快速、准确的实时翻译,语言将不再是沟通的障碍,也许那时候,我们就不需要学外语了。无论是国际会议、日常旅游、还是商务洽谈等场景下,靠AI就能实现无障碍跨国交流了,或许那时候,AI翻译的结果比我们自己直接翻译要更贴合语境,更快更准确呢。
文章来自于 “人人都是产品经理”,作者 “果酿”