随着人工智能技术的渐趋成熟,各行各业都在进行“人工智能 + ”式的转变,其中“人工智能+医疗”作为能够产生划时代变革,且直接关乎人类福祉的领域,得到了更多的关注和青睐。
有人提出,“尽管安防和智能投顾最为火热,但AI在医疗领域可能会率先落地”的观点。
一方面,图像识别、深度学习、神经网络等关键技术的突破带来了人工智能技术新一轮的发展。大大推动了以数据密集、知识密集、脑力劳动密集为特征的医疗产业与人工智能的深度融合。另一方面,随着社会进步和人们健康意识的觉醒,人口老龄化问题的不断加剧,人们对于提升医疗技术、延长人类寿命、增强健康的需求也更加急迫。而实践中却存在着医疗资源分配不均,药物研制周期长、费用高,以及医务人员培养成本过高等问题。对于医疗进步的现实需求极大地刺激了以人工智能技术推动医疗产业变革升级浪潮的兴起。
下面,我们将从人工智能医疗的优势、人工智能现阶段在医疗行业取得的成果、人工智能结合医疗能够在哪些方面进行应用以及人工智能的不足与前景这几个方面来聊一下人工智能在医疗领域的发展状况。
人工智能医疗的优势
现有的传统医疗专家系统,通常是把专家的经验和知识以规则的形式存入计算机中,建立知识库,用符号推理的方式进行医疗诊断。是被动的“填鸭式”的知识获取方式,其主要问题在于:
一些疑难病症的复杂性使其很难用一些规则来描述,甚至难以用简单的语言来表达,原因在于符号的知识表达方式的局限性;
基于规则的专家系统,随着规则库规模的增大,搜索空间的急剧增大,可能导致组合爆炸,并且由于推理循环过程包含了大量无效的匹配尝试,浪费了大量的系统时间,推理效率很低。
产生上述问题的根本原因在于传统医疗专家系统的产生式结构及串行工作方式存在一定的缺陷。因此,只能用于比较简单的疾病诊断,价值有限。
而人工智能采取的是主动学习的方式,能根据输入的声音、图像、文字等数据进行主动学习,根据数据对现有的问题作出最佳的匹配,具体而形象地给出建议。同时根据统计机构IDC的预测数据显示,到2020年医疗数据量将达40万亿GB,数据生成和共享的速度将迅速增长,其中80%以上的数据为非结构化数据。这些数据在为人工智能的学习提供了很好的材料,人工智能能让这些数据发挥更大的价值。
人工智能与医疗的结合,在临床医疗和医疗科研方面都有很大的好处。
现阶段取得的成果
今年,关于人工智能与医疗方面,有两则振奋人心的新闻。
首先是在今年的两会中,人工智能第一次出现在了政府工作报告里,这意味着人工智能已上升为国家战略,成为新的经济引擎。同时,国家卫计委也发布了四份医疗领域应用人工智能的规范标准,从国家层面鼓励人工智能在辅助诊断和治疗技术等应用领域的发展,这一举动则为“人工智能+医疗”的规模化应用提供了基础保障。
另一条则是在世界癌症日当天,目前应用程度最为成熟的沃森(IBM Watson)机器人在中国完成了它的第一次“出诊”。在做现场辅助诊疗时,沃森机器人仅用10秒就给一位胃癌晚期患者开出了与肿瘤科主任医生的初步诊断意见完全一致的推荐治疗方案。这说明人工智能在医疗领域应用方面确实具有巨大的潜力和作用。
事实上,在应用方面,近两年人工智能在医疗领域也取得了一定的实质性的成果。
1、Science报道自学习式人工智能可协助预测心脏病发作
Science杂志报道了英国诺丁汉大学流行病学家Stephen Weng博士团队发表在PLOS ONE上的重要研究成果,Weng博士团队将机器学习算法应用于电子病历的常规数据分析,发现与当前的心脏病预测方法相比,深度学习算法不仅可以更准确地预测心脏病发病风险,还可以降低假阳性患者数量。
在这项新研究中,Weng和其同事对比了ACC/AHA 指导方针和4个机器学习算法:随机森林(random forest)、logistic 回归(logistic regression)、梯度提升(gradient boosting)以及神经网络(neural networks)。为了在没有人类指示的情况下得出预测工具,所有这 4 项技术分析了大量数据,被分析的数据来自英国378256名患者的电子医疗记录,目标是在与心血管疾病有关的记录之中找出发病模式。
2、人工智能诊断皮肤癌准确率达91%
斯坦福大学一个联合研究团队开发出了一个皮肤癌诊断准确率媲美人类医生的人工智能,相关成果刊发为了1月底《自然》杂志的封面论文,题为《达到皮肤科医生水平的皮肤癌筛查深度神经网络》(Dermatologist-level classification of skin cancer with deep neural networks)。他们通过深度学习的方法,用近13万张痣、皮疹和其他皮肤病变的图像训练机器识别其中的皮肤癌症状,在与21位皮肤科医生的诊断结果进行对比后,他们发现这个深度神经网络的诊断准确率与人类医生不相上下,在91%以上。
在测试中,人工智能被要求完成三项诊断任务:鉴别角化细胞癌、鉴别黑色素瘤,以及使用皮肤镜图像对黑色素瘤进行分类。研究者通过建构敏感性(sensitivity)-特异性(specificity)曲线对算法的表现进行衡量。敏感性体现了算法正确识别恶性病变的能力,特异性体现了算法正确识别良性病变,即不误诊为癌症的能力。在所有三项任务中,该人工智能表现与人类皮肤科医生不相上下,敏感性达到91%。
3、第三军医大利用人工智能30秒内鉴定血型,超99.9%准确率
3月15日,权威杂志science刊登的一篇关于中国第三军医大学罗阳团队的最新研究成果,这对于急需输血抢救的病人意义重大,可以为患者节省3-15分钟的时间,增加他们的生还几率,同时也可用于抢险救灾、战场急救等急需验血的情况。
第三军军医大学罗阳团队研发的技术,可以在30秒内检测出ABO血型和Rh血型,仅用一滴血在2分钟内完成包括罕见血型在内的正向和反向同时定型(医生在输血前,为了减少错误,一般要做正反定型和交叉验血试验)。同时团队还设计出一套智能算法,能够根据试纸的颜色变化读出血型,定型准确率超过99.9%。
研发团队为了减少人为识别带来的误差,开发了一套机器学习算法自动识别颜色的变化,同时为了验证算法的准确性,研究人员先用经典凝胶卡片法鉴定3550例血液样本,再通过优化参数操作,算法模型准确的测出这3550例血液的血型。
4、人工智能可预测病人死亡 准确率达93%
在洛杉矶儿童医院,数据科学家Melissa Aczon和David Ledbetter提出了一种人工智能系统,这个系统可以让医生们更好地了解哪些孩子的病情可能会恶化。
他们使用了PICU里超过12000名患者的健康记录,机器学习程序在数据中发现了相关规律,成功识别出了即将死亡的患者。该程序预测死亡的准确率达到了93%,明显比目前在医院PICU中使用的简单评级系统表现更好。Aczon和Ledbetter在Arxiv上发表了相关论文,公布了他们的研究成果。
他们实验的创新点是使用了一种叫做循环神经网络(RNN)的机器学习方法,这种方法擅长处理持续的数据序列,而不是从某一个时刻的数据点直接得出结论。“RNN网络是处理临床数据序列的一种有效方法。”Aczon说,“它能够整合新产生的信息序列,得到准确的输出。”所以在程序中,RNN网络表现得更好,因为它能够随着时间的推移,根据病人最近12小时的临床数据,做出最准确的预测。
5、谷歌研发人工智能眼科医生:用深度学习诊断预防失明
发表于 JAMA 的论文《用于检测视网膜眼底照片中糖尿病性视网膜病变的深度学习算法的开发和验证(Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs)》中,我们提出了一种可以解读视网膜照片中 DR 发病迹象的深度学习算法,这有望能帮助资源有限地区的医生正确地筛选出更多的病人。
研究人员创建了一个包含128000 张图像的开发数据集,其中每一张图像都得到了54位眼科医生中3到7位医生的评估。这个数据集被用来训练了一个可以检测可诱发糖尿病性视网膜病变的病症的深度神经网络。然后两个互相独立的包含大约 12000 张图像的临床验证集上测试了该算法的表现,该测试所参考的标准是一个7或8人的美国认证眼科医生中大多数人的意见。为验证集所选择的眼科医生的意见与训练集原来的54位医生的意见表现出了高度的一致性。
在这项成人的糖尿病性视网膜眼底照片的评估中,基于深机器学习的算法对可疑糖尿病性视网膜病变检测时具有高灵敏度和特异性。 进一步的研究是必要的,这将确认此算法应用在临床中的可行性,并确定与目前的眼科评估相比是否使用该算法可以改善治疗和诊断结果。
限制于现有的科技水平,人工智能现阶段取得的实质性成果并不是很多,但是应用方面,一大波的应用正在到来的路上。
能够在哪些方面进行应用
人工智能对于医疗健康领域中的应用已经非常广泛,从场景来分主要包括虚拟助理、医学影像、药物挖掘、生物技术、急救室/医院管理、健康管理、精神健康等11个领域。这里筛选出五个比较具有代表性的领域,并列举一些初创企业的代表,看看人工智能和具体的医疗应用相结合,究竟能够给我们带来什么样的惊喜。
虚拟助理:利用人工智能诊断疾病
虚拟助理是一个语音助手,与病人交谈是与虚拟助理交互的基本模式。你跟助理说话,通过自然语言处理和语义分析之后,语音助理也会回复你,苹果手机上的Siri可能就是大家最熟悉的虚拟助理。而虚拟助理可以根据和用户的交谈中,能够智能化地通过病情描述判断你生了什么病。
虚拟助理主要包括两类,一类是包括Siri等通用型虚拟助理,另一类是专注医疗健康类的专用虚拟助理。和通用类型助理相比,医疗是一个更垂直,专业度更高的领域,有很多专业术语和专业技能需要我们去学习。我们从五个方面去对比通用类和医健类虚拟助理的差别。通用类虚拟助理上市时间早,资本支持度高,数据规模大。而医健类虚拟助理的专业属性强、监管风险高。虚拟助理是目前较受资本青睐的人工智能医疗健康细分领域,目前在国外用户所熟知的医健虚拟助理是Babylon Health,而国内在虚拟助手上,也有大数医达和康夫子崭露头角。
医学影像:人工智能辅助和代替医生看胶片
医学影像与人工智能的结合,是数字医疗领域较新的分支,而且是数字医疗产业的热点。医学影像包含了海量的数据,哪怕是有经验的医生面对这些数据有时也会显得无所适从。医学影像的解读需要长时间专业经验的积累,放射科医生的培养周期相对较长,而人工智能在对图像的检测效率和精度两个方面,都可以做得比专业医生更快,还可以减少人为操作的误判率。
近年,从图像中识别出目标物体的“图像识别技术”的性能在“深度学习”的帮助下得以迅速提高。X光照片的分辨率为3000×2000像素。其中的恶性肿瘤的尺寸为3×3像素左右。从非常大的图像上判断一个很小的阴影状物体是不是恶性肿瘤,是非常难的任务。首先会将一张胶片进行预处理,然后分割成若干小块,再在每一块中提取特征值和数据库进行对比,最后经过匹配后作出阳性判断。在整个诊断过程中,人工智能也会自己做出深度学习,在病历库中寻找案例,做出自己判断的依据。
在国外,已经出现了数家较为知名的初创企业。表格中的Enlitic就是一家比较知名的人工智能医学影像企业,虽然创立于2014年,但次年就被MIT Technology Review评为2015全球最智慧的50家公司之一,获得总计1500万美元的融资。Butterfly正在研发一种小型超声设备,这套系统主要依靠软件来运行,包括用人工智能专家开发的技术来梳理一系列图像,从而提炼出可以自动进行疾病诊断的功能。
药物挖掘:大幅度降低药物研发成本
一般估计,一种新药的开发平均需要10年时间,耗资15亿美元,但随着药物开发难度的增大目前可能一种新药会耗资40亿~120亿美元,还不能保证成功。新药研发除了要求药品的疗效外,还需要保证其安全性,必须经过动物实验和Ⅰ、Ⅱ、Ⅲ期临床试验。而即便Ⅲ期临床试验后批准上市,还有Ⅳ期临床研究,即新药上市后的再评价。这也是造成药物研发周期长、费用高的重要原因。
但是,有了计算机和人工智能,为人们提供了一个检测药物的人工智能安全专家。首先,在新药筛选时,可以获得安全性较高的几种备选物。当很多种甚至成千上万个化合物都对某个疾病显示出某种疗效,但又对它们的安全性难以判断时,便可以利用人功智能所具有的策略网络和评价网络以及蒙特卡洛树搜索算法,来挑选最具有安全性的化合物,作为新药的最佳备选者。
其次,对于尚未进入动物实验和人体试验阶段的新药,也可以利用人工智能来检测其安全性。因为,每一种药物作用的靶向蛋白和受体都并不专一,如果作用于非靶向受体和蛋白就会引起副作用。人工智能可以通过对既有的近千种已知药物的副作用进行筛选搜索,以判定其是否会有副作用,或副作用的大与小,由此选择那些产生副作用几率最小和实际产生副作用危害最小的药物进入动物实验和人体试验,从而大大增加成功的几率,节约时间和成本。
此外,利用人工智能还可模拟和检测药物进入体内后的吸收、分布、代谢和排泄、给药剂量-浓度-效应之间的关系等,让药物研发进入快车道。
目前人工智能药物挖掘主要在三大领域:抗肿瘤药、心血管药和孤儿药及经济欠发达地区常见传染病药。抗肿瘤药和心血管药的共同特点就是市场规模大、增速快,2015年的销售金额都超过了1000亿美元。利用人工智能对药物进行挖掘,可以显著降低成本和开发难度。而第三种类别的药物孤儿药与经济欠发达地区常见传染病防治药,因为市场价值低,药企的收益不足以覆盖其研发成本,企业积极性不大。那么利用人工智能可以节约成本,为罕见病患者和经济欠发达地区的传染病患者提供药物。
生物科技:带来更好的数据处理
在生物科技方面,人工智能能带给我们更好的数据处理方式。在中国,人工智能在生物技术领域上已经走在了世界的前列,比如在语音技术、生物特征识别方面,甚至能够与发达国家并列。目前,在这方面做得比较好公司的是我国的碳云智能。
碳云智能希望建立一个健康大数据平台,通过收集人们各种各样的生物数据,然后在这个数据基础上建立一个人工智能的内核模型,然后把它对接起来,做这样一个整合。利用人工智能技术处理这些数据,帮助人们做健康管理。碳云智能的数据来源包括两部分,一部分靠自己的技术能力获取,一部分靠合作伙伴获取。靠该团队的核心技术获取的有基因数据、微生物数据(肠道、口腔、皮肤等)、蛋白及代谢数据(尿液、汗液、血液等)等。碳云智能要做的事情主要是将生物技术、生命大数据、人工智能和互联网结合起来。
精神健康:加强诊断和疾病控制
人工智能在人类精神健康方面可以做的事情相当多,我们可以通过两个方面来谈,一个是针对正常人的应用,一个是针对有精神疾病的患者的应用。对于我们普通人来说,人工智能在精神健康方面最大的用处就是情绪识别能力。
情绪识别主要是通过收集人的外在表情和行为变化,对人的心理状态进行推断。能通过面部表情、声音、行为、心率、甚至笔迹,来判断人的情绪变化。最常规的方式通过摄像头来捕捉记录人们的表情,并通过面部表情的变化,分析判断出人的情绪是高兴、生气、厌恶还是困惑等。另一种方式是通过人的声音,说话声音的高低、语速、口气词汇的变化进行智能识别。
即使人会故意控制面部表情和声音不产生变化或者展现出与内心世界不一样的表情和声音,也总会露出一些破绽,只不过可能这些破绽会很微小或一闪而过,让人不易察觉。但对于人工智能来说,发现细微的现象或捕捉稍纵即逝的变化正是他们的长项。从这个方面来说,人工智能对人类情绪的理解可能会比人还优秀。在判断出人的情绪变化之后,就可以通过一些方法,帮助人类进行情绪的管理和调节。
而在精神疾病治疗方面,人工智能能够发挥出更大的作用。2015年3月, 《Telemedicine and e-Health》刊登了一篇用机器学习预测产后抑郁的论文,目的是建立产后抑郁症发作的风险分层模型,以便提前干预。同时开发一款APP,目标用户是产后希望了解自己情绪的妈妈。同时,人工智能在PTSD(创伤后应激障碍)方面的诊断和治疗,以及对精神疾病的监控上,能起到相当大的作用。
不足与前景
人工智能在医疗领域发展形势喜人,但就目前来看,依旧存在一些不尽人意的地方。
首先,人工智能技术最大的作用在于整合海量的信息,从中筛选出有价值的数据,以此作为医生诊断的辅助。但是到真正治疗阶段,则更多的需要医生与患者面对面进行沟通与交流,来确定合适的治疗方案。对于医学来说,临床经验、逻辑思维也是十分重要,而这样的能力不能靠储存多少海量的医学数据、病历档案就能得到提高,人工智能在这一方面的能力还有很大的进步空间。
其次,就人工智能技术而言,实现诊断,乃至治疗这一阶段,其精确性还不够。简单的来说,人工智能就是一组参数不确定的函数,参数的确定需要海量的数据来完成。数据越多,参数的范围也就会越小,人工智能在医学上的精确性也就越高。但就目前来说,要达到精确性极高的程度,需要的数据量将是一个难以估算的程度。
尽管还有不少亟需完善的地方,但是技术一直在发展与更新,假以时日,人工智能一定能超越人类,让我们共同期待新技术带来的惊喜吧。