机器学习等人工智能算法
在传媒中的应用
第二期我们请到的专家是留学美国多年的杨博士,也是人工智能和传媒领域的资深专家,今天请他给大家分享一下他关于人工智能与传媒的结合领域的研究:
智能化是传媒领域深度发展的必然方向,人工智能领域的机器学习方法是全媒体传播体系支撑技术之一。智能媒体总体的生态又分为基础层、技术层和应用层,其中基础层和技术层为智能媒体发展提供算法、算力和数据等基础支撑能力,应用层面向传媒需求场景提供智能软硬件产品与解决方案来提升媒体智能化程度,目前基本覆盖智能采集、智能生产、智能分发、智能风控、智能反馈、与商业化等环节,机器学习算法对传媒行业整体赋能效应初步显现。机器学习算法将在未来通过消费端和供应端的高效协同与精准匹配实现传媒行业资源的优化配置,智能媒体生态更是将实现从战略蓝图到常态执行,从技术决策到价值引领,从感知智能到认知智能,从单点突破到平台层赋能,从陪衬地位到全面赶超领跑的全方位跨越。
1 智能传媒发展背景
21世纪初期20年,伴随着大规模的GPU服务器并行计算、大数据、神经网络(深度学习)算法和智能芯片等技术的快速发展,人类社会先后经历互联网时代、大数据时代和人工智能时代,人工智能成为当前的战略支点。整体来看,我们目前正处于人工智能发展的第三个阶段:感知智能阶段,人工智能机器学习算法开始全面融入社会生活。在这个阶段深度学习和强化学习成为最主要的技术发展特征,“深度学习框架+应用场景”成为了当下人工智能的主流发展模式,构成了人工智能发展的基础和核心,也是未来技术发展的关键所在。人工智能正在不断赋能各个行业并且改变原有行业的传统面貌,全球传媒格局同样正在被人工智能机器学习算法所重塑。国际方面,Google、Facebook、Twitter、Amazon等科技巨头借助技术实力和平台优势大举进入传媒领域。与此同时,华盛顿邮报、纽约时报、彭博社、CNN、BBC等老牌传统媒体也纷纷开启人工智能计划来应对智能传媒时代的挑战。国内方面,百度、腾讯、阿里、字节跳动、新网等头部互联网平台在传媒人工智能应用方面积累了先发优势,以人民日报、新华社、中国广播电视总台等为代表的新型主流媒体正在加速传媒的人工智能布局。智能化是我国传媒深入发展的必然方向,机器学习算法正在为全媒体传播体系建设提供强大的技术支撑。
2智能传媒生态结构
从结构上看,我国的智能传媒行业总体可划分为基础层、技术层和应用层。其中基础层提供算法、算力和数据等基础要素支撑,是未来行业发展的通用基础。应用层面向传媒行业需求和应用场景,提供智能化的软硬件产品和综合性解决方案,用于提媒体的智能化程度。
基础层包括智能芯片、智能传感器、大数据资源、云计算平台等,为智能化发展提供基础硬件、数据和算力的基础支撑能力。其中,智能芯片是人工智能的核心硬件,提供高性能并行计算能力。智能传感器实现高精度信息采集和有效信息反馈。开源框架为开发者提供机器学习开发框架及基础功能,是人工智能机器学习基础算法的底层架构和接口,当前主流开源框架有Tensorflow、Torch、Caffe等。大数据通过采集、分析对海量数据进行处理,为机器学习算法提供数据基础,是人工智能发展的基石。云计算为机器学习算法提供算力支撑,提供数据存储和算力服务,实现强大的网络服务能力。
技术层主要依托基础层的运算平台和数据资源,以深度学习为代表的机器学习算法进行海量信息识别训练和机器学习建模,开发出面向各个领域需要人脑解决某类问题的一系列应用技术和解决方案。其中,机器学习是一门多领域交叉学科,专门研究计算机怎样模拟或实现人类的学习行为以获取新的知识或技能,重新组织已有知识结构使之不断改善自身的性能,其中深度学习是近十年来发展最快的一个分支领域。
在传媒应用层,机器学习等人工智能技术深入传媒行业,与媒体场景融合,结合传媒行业具体需求和应用场景提供智能化软硬件产品和解决方案,目前已在传媒行业价值链全链有所应用。
3中国传媒应用创新
机器学习技术被运用到新闻生产传播的各个环节,数据采集机器人、机器人写作、虚拟主播、智能采编、算法分发、智能媒资管理、智能营销、智能舆情监测、版权保护等新产品、新应用层出不穷,人工智能尤其是机器学习算法对我国传媒行业的全局赋能效果初步显现。
3.1 智能采集
智能传媒时代,信息采集逐步告别了传统人工时代,拓宽了信息采集维度,高效完成多面识别,助力新闻工作者从信息海洋中迅速锁定线索,高效完成新闻报道工作。借助人工智能和大数据,新闻工作者可快速挖掘社交媒体及各平台的新闻数据,快速找到线索和有效关联信息,拓展对更多新型信息采集终端的数据利用,高效完成语音文字转化及跨语种信息采集等工作。
社交媒体信息采集方面,运用智能技术可对社交媒体进行数据挖掘,通过实时信息获取与存储热点信息构建知识图谱,形成智能化线索采集系统。典型代表是新浪自主研发的“鹰眼”平台。“鹰眼”以微博、新浪网内容为核心同时结合全网头部信息,运用大数据、机器深度学习与实时计算,帮助采编团队对新闻热点的酝酿、引爆、爆发、传播过程进行建模,通过对某一热点新闻阅读量、转评量、点赞量的变化分析,尽早发现潜在新闻热点并第一时间向用户推荐。
语音数据采集转化与多语言实时翻译与采集方面,Google退出的LiveTranscribe是一款Android语音识别转录工具,可以为70多种语言和方言的口语单词实时添加字幕,即便在网络不发达的国家地区,转录延时也不超过200毫秒。科大讯飞推出的讯飞听见、智能文稿唱词系统等国内语音转文字的代表
产品。
3.2 智能生产
在新闻生产环节,机器写作,智能多媒体编辑、可视化新闻与虚拟主播等技术可将新闻工作者从高重复性工作中解放出来,使其更加专注于创意策划与深度报道环节。
机器人写作运用机器学习算法将数据进行加工处理并转化成叙事体新闻文文本,使得体育、财经、自然灾害与突发事件新闻报道效率大幅提升。虽然完全的自动写作商难全面铺开,但新闻工作者运用智能采编工具可以快速完成新闻生产,挖掘运营优质精品内容的人机协同方式已经成为新的常态。
3.3 智能分发
在新闻传播环节,基于机器学习算法的个性化智能推荐成为主流信息分发模式,智能算法彻底改变了信息传播关系和传播全力结构,算法正在成为智能传媒时代新的“把关人”。机器学习算法通过采集用户属性、行为数据,分析、推测用户对内容的偏好和潜在需求,在此基础上依靠算法自动抽取、整合、编排信息、最终实现个性化、定制化的内容推荐。以Facebook为例,其采用边际排名算法并紧扣用户社交关系进行新闻分发,最大化发挥了社交关系优势和流量优势。
3.4 智能风控
针对互联网平台内容尤其是视频内容的审核,是互联网治理的关键之一。内容风控基于对多模态视频数据的智能化理解,提高审核和内容管控的及时性和准确性,实现对海量内容高效智能识别和审核。
新华智能云退出的“媒体大脑3.0”内容风控基于深度学习多模态理解,对图像、文本、视频进行检测,涵盖人脸核查类、敏感表示类、敏感旗帜类、军警服饰类、色情、恐怖、暴力类、涉政敏感类、武器类、国家标志类等类别识别率已达到业内领先水平。
3.5 智能反馈
媒体通过海量数据处理和超大规模计算可对用户反馈进行实时评估与综合评价,使内容生产者可以对各个环节进行调整,提升运营效率,同时为舆情管理、虚假信息治理、版权保护提供依据。
大数据挖掘、语义分析等智能技术可以对网络舆情进行深度分析,准确把握当前舆论态势,提高舆情预测、预警和研判效率。
3.6 智能商业化
在商业变现环节,综合利用计算机视觉、机器学习、自然语言处理、知识图谱等技术可以助力媒体机构实现场景话精准营销,通过挖掘用户特征、行为习惯、兴趣偏好、消费倾向,将广告与消费场景相结合,提供更多场景互动和精准定向策略,拓展商业模式,提升媒体机构的盈利能力。
总之,机器学习等人工智能技术的应用已经从工具级、产品级到发展到平台级创新,同时,以人工智能为基础的智能传媒平台也正在蓬勃的发展。
原创文章,作者:afeng135,如若转载,请注明出处:https://www.521dj.com/224756.html