趋势网(微博)讯:最近笔者接到不少来自医疗行业的咨询:“我们医院想利用大数据技术,但是不知道买什么样的系统比较好?”的确,很多能提供大数据相关解决方案的企业的说辞都十分吸引人,“利用医疗大数据,实现个性化医疗”、“活用大数据可以削减医疗成本”等等。可是医疗行业的大数据技术究竟是什么?个性化医疗具体是对什么样的病患进行什么样的治疗?就这些问题,我们都还不能给出明确的答案。
所以,趋势网和笔者今天就要来探讨一下现在“各行各业阿猫阿狗,人人皆谈大数据”的现象。
上海某中学疑似调查学生家庭背景阶层 美媒测算特朗普已获超200张选举人票 乌克兰称已同朝鲜军队发生交战 蒂芙尼成都太古里店被砸 徐艺洋扇完巴掌黄子韬就老实了
运用大数据技术最成功的企业,当数Google和Amazon。人们的脑海里已经形成了“Google利用大数据取得了广告业务的成功”、“Amazon利用大数据实现了电子商务的成功”这样的思维定势。但因为这些范例,就认为大数据能帮助医疗企业实现个性化医疗和削减医疗费用,这种想法是有失偏颇的。
成功利用大数据技术的企业都有一个共同点——“商用硬件”和“开源软件”的使用。对于普通用户来时,商用硬件和开源软件的采购存在一定难度。但对Google和Amazon这等大公司来说,根本就不是问题。
当然,能负担商用硬件和开源软件的医疗企业也不在少数。接下来的一个关键就是“生成大数据”。Amazon之所以成功利用了大数据技术,那是因为它能把顾客可能想买的商品在适当的时机推荐给顾客。但是利用大数据的前提是有数据。大数据利用的第一步从收集可能产生价值的数据开始。很多企业将数据作为自己的战略性资产,并不对外公开。所以实际上很有可能收集不到数据。
如果收集到了数据,又应该怎么办呢?三个关键词,也可以说是三V。Volume(量)、Variety(种类)、Velocity(速度)。以医疗行业为例。患者在医院接受检查和治疗的数据,血液检查(血糖值和胆固醇等)的结果数据和报告;拍片透视和心电图等图像资料;会计上的健康保险理赔、个人偏好等。都是数据量的体现。数据的种类可以从彩色录像中体现。除了以往的CT、MRI、X射线等,还有心脏检查的超声波、B超。这些超声波可以用录像形式保存;血液流动、手术记录等都可以形成录像。数据的速度,说的说保存数据的时间间隔。比如说一秒保存1次体温、血氧饱和度、血压等。保存过去4年的数据等。
“数据技术”方面,通过SQL语言操作和关联数据库。将收集的数据填入二维的Excel表格中,通过构建多个表之间的关系,实现多维数据分析。比如说分析季节性流行病的集中发病时段、季节性变动情况等。利用Hadoop分布式处理框架,将数据存储到HDFS文件系统,通过MapReduce实现大数据的分布式处理。可以对过去病例药效和反应的分析,调整用药量等。
数据分析的雪花模型
更高层次要求的是“数据科学”。利用如朴素贝页斯、决策树、关联规则、聚类分析、时间序列、神经网络、回归分析等算法,对未来进行预测。
总的来说,先要摒弃商业运作的思维定势,然后从“数据”“技术”“科学”三个视角解答活用大数据的关键。运用专业人才,不盲目依赖数据。什么数据、怎么组合、什么技术、怎么处理。这些问题都要靠企业自己去思考。
(趋势网按:翻译概括自帝京大学医疗信息系统研究中心泽智博教授在ITpro上的同题文章)