热门关键词:凯旋门国际平台,凯旋门国际平台首页  
凯旋门国际平台_好未来AILab负责人刘子韬:AI+教育中的四大挑战|CCF-GAIR2019
2020-12-17 [2867]

7月12日至7月14日,2019第4届世界人工智能机器人峰会(CCF-GAIR 2019 )在深圳月举行了会议。 峰会由中国计算机学会(CCF )主办,由香港中文大学(深圳)主办,深圳市人工智能和机器人研究院主办,得到深圳市政府的大力指导,国内人工智能和机器人学界、工业界和投资界三个领域的顶级交流博7月14日,议程预计将转移到第三天,这次大会也进入了1日的智力教育专场。 在这个专集中,良未来AI实验室的负责人刘子韬博士在同一个舞台上,发表了题目《Building The Next Generation of Smart Classroom》的主题演说。

在演讲中,刘子韬从良好的未来知识课堂探索和研究实践出发,谈了AI教育发展过程中数据提供的复杂性,谈了AI教育中的四大挑战。 每一个,一个是数据量少。 机器学习需要有标签的数据,但教育场景的大部分数据没有标签,有标签的数据非常少。

第二个是异构化。 异性和多模式被强力初始化,有从不同来源生成的数据,有天然的异性。 三是数据质量问题。

一般来说我们的标签提供很难。 我想预测上节课这门课好还是坏。 好还是坏必须贴上标签。

这时标签的主观很强,10个人给老师评分,6个人可能比较好。 四个人不好。 这门课是好是坏,谈谈6:4。

这是模糊的。 第四个是评价。 短期内无法分析,对AI有一些困难和影响。

据此,刘子韬讲述了在将来面临挑战的过程中明确提出的AI与解决办法相关,得到了适当的案例。 例如,标记数据众包、工作辅助测试和在线类监视。 最后,刘子命令得到了自己的意见: AI在参加教育应用过程中遇到的许多问题尚未研究。

这里面有很多挑战,当然有很多机会。 演说结束后,刘子韬拒绝接受(公众号:)的采访。 针对AI如何接受教育的问题,刘子命令通过AI作为技术本身从根本上提高效率,像Google一样提高了人们检索和获取信息的效率,AI在一定程度上可以在教育领域提高效率。 例如,作业的自动考试和教育领域的运营管理(例如训练机构)等。

不仅如此,AI需要在教育范围内提高产品体验,是学生们自学更好的体验。 比如智能教室等。

以下是刘子命令在CCF-GAIR大会上的演说内容,展开了不改变意图的编辑整理:早上好! 今天代表未来与大家分享未来在知识课堂上的探索和研究。 今天主要谈谈我们的进展和全过程中面临的困难和挑战。

美好的未来是以智力教育和开放平台为主体,以素质教育和课外指导为载体,在全世界服务公务教育,支持民办教育,探索未来教育新模式的科技教育公司。 美好未来的人工智能实验室是美好未来在集团范围内的AI Lab,其作用是通过AI技术给予未来的各业务线,让美好未来的各事业部享受先进设备的AI技术。

对美好未来的AI来说我们会超过什么目的? 我们有四个愿景。 一是期待在AI得到更好的教育内容。

二是想在AI中获得更有效的教育体验。 第三,我想获得更科学的评价系统。 四是更公平的教育资源。 我们提到教育和AI教育时,最重要的是什么? 我们希望的最重要的是教育环境Learning Environments。

当我们谈论教育场景时,我们可以做出非常简单的区分。 例如,z轴可以看到教室里有多少学生。 例如,可以是一对一的,也可以是在线的小班。 3~9个也可以。

传统的面试班有20到50个学生。 大班网络学校可能没有90,100,500名学生。 这是班上的学生人数。

横轴是年龄,也可以是幼儿园、小学、中学、高中、大学。 纵轴是放学后的形状。 放学后的形式可以分为线下放学后、教学点线下放学后、线上直播方式。

学生在学生家,老师在老师家以直播的方式放学。 这里列出几个纬度,教的有数学课、英语课、物理课等学科。 有不同的维度,可以细致地区分场景。

其中每一个都有独特的特性。 例如,在教小学的网上一对一和教传统的网上教大班高中生只是相当大的区别。 自学的场景没有不同,生成的数据不同,教育设计的理念没有不同。 对于不同的教育场景AI,需要针对每个块展开优化和定制。

教育和AI最重要的是什么? 非常丰富的数据,数据是可以在每个场景中生成的数据。 这些数据的生成也选择两个维进行区别。

上面一行是数据什么时候生成的。 首先放学后会生成什么样的数据? 除了一些学生上课的前面,还不包括家长、销售和学生之间的交流记录。 接下来在上课。

上课时不会生成宝贵的数据。 再次放学后,放学后不会产生学生课后练习问题、家长系统、对家长的报告。

生成数据的主体是老师、学生,中间有相当多的环节,这里不叫管理者。 你是什么样的管理者? 管理者是比较绿色的概念,在教育整体的趋势中,上课前、上课中、课后,教育管理者有被称为与监护人交流的自学规划师、顾问的地方,也有被销售的地方。 包括管理老师的人。 大家在训练机构里有很多老师,如何管理老师,使他们的教育质量完全一致,正规化,这些生成很多数据。

这里是细粒度的划分。 我推荐几个例子。 上课时老师能做什么? 老师可以和学生开始语音会话Voice Interaction,可以和学生改变脸,直播时老板学生可以改变脸,改变场景。

老师手里有什么?老师手里有很多Pad,智能笔。 学生手里没有很多答题器。 学生可以通过答题器和老师对话。

上课的环节没有很多数据。 管理者有售前销售、向监护人销售什么课程、和销售的聊天记录。

放学后,自学规划师不与家长交流或交流。 也不告诉这门课的学生孩子是怎么做到的。 这些都有交流,不会作为数据溶出。

数据的生成和全过程的控制对AI是最重要的。 我先谈了教育的数据,每个阶段都可以生成各种各样的数据。

这些数据生成后会怎么样呢? 更学术的语言是Multimodal,也就是多模式,主流的多模式没有三种融合:一种是文本数据,很多数据是以文本的形式生成的。 二是放学后经常不以视频的形式记录,没有视频的信息。

第三,有一些语音信息。 中间老师说了什么,学生听到了什么,这些数据不会被记录下来。

凯旋门国际平台

对AI来说,这些是宝贵的资源。 这一定是Multimodal Machine Learning。 今年CMU的教授写了一篇很好地总结Multimodal问题的新文章。 这里有五个大问题。

1、Multimodal的情况下,我们是如何密切相关的? 翻译,有视频数据和音频数量。 3、Alignment,这两个应对一起,老师谈论教材。 这个教材是惯性的,在第一批上课品上,第二批在教材下。

4、Fusion融合。 5、合作学习。

明确应用于必备的AI技术。 这是大家解读的,更好的是方向,Multimodal Machine Learning必须识别不同的数据。

必需的AI技术也是各种各样的融合过程。 比如Speech,我们需要ASR,减振的方法比如数据挖掘,需要更综合的能力。

我们预测学生什么时候不陈列,介绍最适合学生的老师,介绍一些个性化科学知识地图,所需的各种技能不同。 另外,很多模型配置在末端,教室的资源受到限制,我们在末端没有一些模型的加速和优化。 刚才谈了数据和AI领域,我们之间不会遇到什么样的挑战? 这里的挑战非常多:一个是小数据。 虽然可以在各种教学场景中生成大量的数据,但是大部分数据没有标签,小数据意味着标签的数据不太少,机器学习是需要标签的数据。

第二个是异构化。 异构化和Multimodal被强初始化,数据来自不同的源,有天然的异构化。

三是数据质量问题。 数据质量是什么意思? 高质量的标签提供非常困难。

我想预测上节课这节课好不好。 好不好必须贴上标签。

这时标签的主观很强,有可能打给十个老师。 六个人可能很好。 四个人不好。 这门课好不好不一样。

四是评价,短期内无法分析,对AI有一些困难和影响。 基于上述问题,美好的未来应用了一些接地的AI,明确解决了在问题良好的未来场景中解决问题的问题。 我们部署的系统确实用于美好的未来,每天处理成千上万堂课。

这些工作公开在WWW、ICDE、AIED等会议和顶级杂志上。 另外,还包括我们部署的系统。 包括上课的监视和我们做的中文评价传达。

我推荐几个例子。 第一,我们今年已经在澳门的ICDE公开发表了。 如何在自愿包装的标签中开展自学? 为什么我们必须自学标签,做众包? 我们必须自学大量的数据。

不仅需要大量的数据,而且需要正确的标签。 在现实世界中,有标签的数据很小。

我们怎么办? 就是找马克。 这是毫无疑问的。

寻找标志是Crowdsourcing。 寻找标志的数据一定不是大量的数据。 基于这种情况,如何用现有的方法解决问题的现有问题? 我们的数据量受到限制,可以做一些Grouping。

蓝色是事例,红色是负的例子,蓝色是100,红色是50个,一共是150个样品。 这不能深度自学。 样品每个都很小,但我们可以和一些人进行筛选。 通过一群人我们可以制作很多样品量。

5个人贴标签可能是3比2,在最简单的情况下,3比2闻到可信度,给0.6,但每个标签都不同。 我们明确提出了深度自学的框架,通过Grouping的方法和对样品标签的Confidence和Model Learning,可以得到深度自学的模型。

明确细节可以详细阅读我们的论文learningeffectiveembeddingsfromcrowdsourcedlabels 3360 aneducationalcasestudy。 下面对自动评分作业进行说明。

自动测试的场景是什么? 自动测试不是你给我的中考试卷,我给你改了几分,只是想解决问题的特定问题。 例如,一个学生在家解决方法的问题是他父母在侧面拍电影小视频,这个视频没有传播到我们的后端,后端没有程序。 这是数据生成的场景。 我们不给学生布置主题。

美好的未来不叫口述问题。 口述问题想解决问题吗? 众所周知,对于外国人的开朗,中国人以前接受的教育令人钦佩、高调,可能会变得更木讷。 我们期待中国人在这方面不输给外国人,我们从小就在培养学生的中文口语表达能力。

基于这个大背景,我们希望孩子们有时,我们希望小学生有问题。 他可以介绍这个问题的过程。

我们希望他能介绍一下,不管这个问题的答案如何。 这是我们设计问题的想法。 从明确的案例来看,这个主题很受欢迎,效果也不下流,但背后有几个问题。 老师不能改变。

比如一个班有30个学生,一个学生上传2到3分钟的视频,老师听评论,写,改,一个学生老师花5分钟,有30个学生,老师凭空花150分钟,很浪费时间, 那AI能给老板老师做辅助测试吗? 基于这样的想法,我们设计了AI辅助试验解决方案。 我们有学生的答案和老师的标准答案。 我们两个文本都没有。

通过Transformer和Multiway Attention,对学生提出的回答和相关问题展开深入的语义融合和赋予,构建口述问题的辅助测试。 我们做了很多实验。 我们用创造性明确提出的方法,打破了传统的机器学习方法,深刻的自学方法。

明确构建的详细内容可以参照我们今年在AIED上公开发表的论文automaticshortanswergradingviamultiwayattentionnetworks。 介绍在线等级质量管理系统——在后台在线的现实系统。 我建议一个非常简单的例子。

这是传统的网上一对一放学后画面,旁边是老师,旁边是学生,中间是课件。 其中的问题是什么? 这门课下只有学生教。 只有老师会告诉我。

没有其他人告诉我这门课的事。 因为父母会躺下来看。 如果这个学生马上及格了,他就不要让恋人自学,成绩不好,经常在家玩游戏。 如果这位老师没有很好地教学生上课,教学生怎么玩游戏,会不会再发生什么事情? 学生很开心。

父母让学生学习这门课怎么样? 学生会说这位老师教得特别好,教得特别好……这种情况我们不希望再次发生。 我们想杜绝这些传统课上不应该再次发生的现象,人工检查的方式一定很接近。

这个案子非常可怕。 家长一旦发现这种情况,家长依然相信这个品牌,不会产生下课和一系列可怕的名声传播。

所以我们期待着用AI监视课程的质量。 学生维和老师维度由我们监视。 在学生的维度上,我希望这门课的学生频繁开口。

我们不监视学生的传达次数。 还包括学生是否自主提问、学生提问次数、学生是否拒绝老师的笔记等。

我更不监视老师的纬度。 我们希望提高整体的教育质量。 红线(老师上课说骂人话吗),老师沉默的时间,老师在问学生问题,老师带学生记笔记,老师在说与学科有关的东西,不是闲聊之类的。

第一步是非常简单的运营手段,有了这个我们就有运营的管理闭环,坏事再次发生,可以对老师展开处理。 这是AI落地教育管理运营的闭环。 这不是我们最后的目的,我们的目的是获得用AI淋漓尽致的教育体验和更好的教育效果。

这个教学体验可以通过AI展开多维分析。 我们叫“四色等级”。 红色是最好的。 绿色是最差的。

上节课评价课程。 如果是红色的话,这门课非常差。 随着课程的进展和变化,效果会很好。

最后是绿色。 这是课程的分析。 在实现AI教育的过程中,有很多挑战,有很多机会。 其中解决问题的许多问题是学术界不存在的问题,也包括众包相关的问题和许多小数据问题。

现阶段学术界的很多东西才刚刚开始,包括小样本自学。 我刚才说明了AI教育的挑战和落地的应用,但往往里面的机会相当大,还有很多问题没有研究。 这里的挑战是巨大的,同时也有相当大的机会。 谢谢你,《AI投研邦》将于近期上线CCF GAIR 2019峰会的原始视频和主要主播。

问题专业领域白皮书还包括机器人尖端专业领域、智能交通专业领域、智能城市专业领域、AI芯片专业领域、AI金融专业领域、AI医疗专业领域、智能教育专业领域等。 “AI投研邦”的会员们可以免费观看年度峰会的视频和研究报告的内容。 扫描码可以转到会员页面,得到更多的理解,也可以接受私信助教的穆(微信: moocmm )咨询。

原创文章,发布许可禁令刊登。 以下,听取刊登的心得。:凯旋门国际平台首页。

本文来源:凯旋门国际平台-www.worldfootgolf.com