图5.6以网络为中心的计算驱动力量、增长领域与示例值得注意的是,美国国防部的Net-Centric的数据策略是从用户出发考虑的。根据DoD的描述:以网络为中心是指实现一个联网环境,包括基础设施、系统、过程和个人,使之能够按照完全不同的方式实施战斗和商务活动。以网络为中心的基础是GIG。以网络为中心,通过安全互联时间或地点独立的人和系统,充分支持军事态势知识的改进和更好地访问商务信息,大大缩短了决策周期。......
2025-09-30
健康领域的信息化发展很快,尤其是在医院信息化中。健康信息化系统(healthcare information system,HIS)的涉及面很广,涉及的数据量大且结构复杂。
1.智慧健康和智慧医院
随着卫生保健系统在世界范围内日益增加的复杂性和现代医学日益成为一种数据密集型科学的事实,使得医学问题与大数据分析密切关联。同时,智慧化成为卫生保健的主要关键词。
低成本、微小型、轻型的智能生理传感器及其网络(尤其是无线通信网络)开始广泛使用在卫生健康领域。泛在计算和情景感知计算在卫生健康领域里也被逐渐推广使用。
智慧健康成了民众的迫切需求,随之又导致了智慧医院的需求和建设。
2.医学在变成数据科学
当前,药品的设计和研发与数据科学的关联度超过了其与生物学或医学的关联。生命科学在日益成为数据密集科学。在生物信息学和计算生物学中,我们面对的不仅是数量日益增加的、异构和多样的、高度复杂的、多元和弱结构化的、富含噪声的脏数据,而且建模需求的快速增长。学术界提出了P4医学(P4-medicine)概念,即预测性(predictive)、预防性(preventive)、参与式(participatory)和个性化(personalized),试图实现精准医学。因此涉及更大数量的复杂数据集,特别是所谓显微镜下的数据(omics-data),包括来自基因组学(genomics)、表观基因组学(epigenomics)、元基因组学(meta-genomics)、蛋白质组学(proteomics)、代谢物组学(metabolomics)、脂质组学(lipidomics)、转录物组学(transcriptomics)、表观遗传学(epigenetics)、微生物组学(microbiomics)、通量组学(fluxomics)、表型组学(phenomics)等的数据。
3.人工智能和智慧医学
人工智能在医学上越来越重要。IBM公司的Watson是一个典型的人工智能平台,其在医学领域应用多年,有很多成功样例。知识推理是该平台的重要基础。可以说,推理过程在医学上扮演着重要角色。
推理是按逻辑方式考虑某个事物或事件的过程,以便形成一个结论或判断。医学诊断过程可以看成是一个推理过程。当然,从医学推理看,人和计算机还是有差异的,我们使用参考文献[4]中的一张表来将两者进行比较(见表22.1)。(https://www.chuimin.cn)
计算机系统按照预先描述的算法采用二进制代码处理数据。它们从海量数据中找出相关性,找出关系,结果与各局部成分之和等同,即1+1=2。
医学实践中,人类的推理,在归纳确认和设证推理的精细化中会受到阻碍,原因是偏差的存在和概率计算理解的不足。这里,偏差主要包含以下几点。
表22.1 人和计算机在医学推理上的对比
●定位偏差(anchoring bias):在支持的充分数据可用前仅关注单一的概念。
●确认偏差(confirmation bias):只收集支持一个假设的信息。
●提早关闭(premature closure):过早地结束推理过程,忽略对替代解释的评估。
计算机系统可以借助概率统计,不屈服于这些偏差。因此,在医学上,计算机系统的应用越来越广泛。
为了适应数据在医学中的发展,有必要对医学数据进行深入讨论。下面先讨论一些术语和标准。
相关文章
图5.6以网络为中心的计算驱动力量、增长领域与示例值得注意的是,美国国防部的Net-Centric的数据策略是从用户出发考虑的。根据DoD的描述:以网络为中心是指实现一个联网环境,包括基础设施、系统、过程和个人,使之能够按照完全不同的方式实施战斗和商务活动。以网络为中心的基础是GIG。以网络为中心,通过安全互联时间或地点独立的人和系统,充分支持军事态势知识的改进和更好地访问商务信息,大大缩短了决策周期。......
2025-09-30
可以将Client/Server系统看成是完全的集中式系统,将Gnutella这样的P2P系统看成是完全的非集中式系统。我们可以从以下三个方面来区分集中式系统与非集中式系统。在机构上,DNS本身不是集中式的而是分散式的,但是其发现服务是集中式的,由DNS服务器提供服务。图18.2两种P2P的文件分享形态3.资源通信分布式系统中的资源通信包含以下两种方法。......
2025-09-30
Oracle公司的OPS环境比一般的(单实例)Oracle环境复杂得多。不同结构下的OPS的实施略有不同。图14.23OPS体系结构为了利用这些特性,需要专业人员合适的设计以及恰当的手工配置。下面对有些关键问题进行简单讨论,讨论中会涉及一些Oracle系统专用的术语,读者可参阅Oracle公司的相关文档。DLM与Oracle进程一起工作并相互通信。DLM相关的初始化参数在每个实例的SGA[12]中分配必要的结构以处理消息机制、封锁与实例相关的Cache管理,这样就为各种Oracle进程操纵提供了基础。......
2025-09-30
为了说明综合数据库,有必要讨论什么是数据仓库及其特点。多维性是数据库仓库的一个重要特征。数据仓库的关键是数据的存储和管理。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。相对于操作型数据库来说,数据仓库数据库的突出特点是对海量数据的支持和快速的检索技术。......
2025-09-30
实现并行数据库系统依赖于分布式数据库技术。图14.9Teradata DBC并行数据库系统的硬件体系结构图14.9中的DSU是disk storage unit的首字母缩写,负责存储数据。其中,IFP处理来自本地连接终端的请求,COP处理来自网络的请求,因此称为通信处理器。图14.10Teradata DBC示意图图14.11Teradata IFP示意图由图14.12可知,通信处理器COP的主要组成模块是网络接口、负载均衡、会话控制、输入数据转换、SQL解析器、调度器和Ynet接口等。图14.12Teradata COP示意图图14.13Teradata AMP示意图......
2025-09-30
要在并行数据库系统中查找数据,首先要确定数据由哪些处理器管理,放在哪里,这就是数据定位。因为希望在数据所在处执行程序,所以数据定位就是判断系统性能好坏的一个重要因素。有round-robin分割、哈希分割和归类分割三种基本分割方法,如图14.14所示。图14.14不同的分割模式round-robin分割是最简单的一种分割方法,它能保证均匀分配。图14.15Teradata DBC的数据分布由图14.15可知,Teradata DBC采用的策略是将数据均匀地分布到其存储设备中。......
2025-09-30
数据分片是分布式数据库特有的现象,后面章节会详细讨论。典型的数据分片有数据水平分片、数据垂直分片和数据混合分片。完整性是指分片不应丢失数据,即一个关系的所有数据都应有自己的归属,总会落在一个数据片里。可重构性是指数据分片后能重组成原形。不相交性是希望数据片的归属是唯一的。图2.11数据分片示意图下面讨论主要的数据分片形态。......
2025-09-30
显然,更新操作比只读应用要复杂得多。Student1Student2一旦实施这个操作,这个学生归属系的系别编号就会修改为14,关于学号20080833的记录会迁移到另外两个数据片Student3和Student4中。由上可以发现,由于分布透明性的要求,使得普通的用户查询在实施时变得很复杂,而且会有多种实施方式,因此,对查询优化提出了新的需求。......
2025-09-30
相关推荐