《数据管理技术发展的三个阶段:从原始到智能的演进历程》
一、人工管理阶段
在计算机技术诞生初期,数据管理处于人工管理阶段,这一阶段具有鲜明的特点。
(一)数据不保存或很少保存
当时计算机主要用于科学计算,计算任务完成后,数据就不再被保留,因为硬件存储设备的容量非常有限,例如早期的磁鼓存储器,其存储容量只能以千字节来计量,并且价格昂贵,而且当时没有认识到数据本身的重要性,重点是放在计算结果上,只有在极少数情况下,当数据有特殊价值且存储空间允许时,才会进行简单保存。
图片来源于网络,如有侵权联系删除
(二)没有专门的数据管理软件
数据的管理完全依赖于程序员,程序员在编写程序时,要自己设计数据的存储结构、定义数据的逻辑结构以及编写输入输出程序等,在进行一个简单的员工工资计算程序时,程序员需要在程序中详细地规定每个员工数据(如姓名、工资额等)的存储位置,是存储在内存的某个固定地址,还是通过某种简单的编码方式存储在外部存储介质(如纸带等)上,这就导致了程序和数据紧密耦合,一旦数据结构发生变化,如增加了员工的奖金字段,整个程序都需要重新编写。
(三)数据面向应用
数据是为特定的应用程序服务的,不同的应用程序拥有各自独立的数据,这些数据之间几乎没有共享性,一个企业中用于计算生产产量的程序和用于统计员工考勤的程序,它们的数据是完全分开的,并且存储方式、格式等都可能不同,这就造成了大量的数据冗余,因为相同的数据(如员工编号)可能在多个应用程序的数据集中重复出现,数据的一致性也难以保证,当某个员工的编号在一个应用中被修改,其他应用中可能仍然使用旧的编号,从而引发数据错误。
二、文件系统阶段
随着计算机技术的发展,特别是硬件存储容量的增加和成本的降低,数据管理进入了文件系统阶段。
(一)数据以文件形式长期保存
文件系统提供了一种将数据组织成文件并长期存储在外部存储设备(如磁盘)上的方式,文件成为了数据管理的基本单位,用户可以通过操作系统提供的文件管理功能对文件进行创建、删除、修改等操作,企业可以将员工信息存储在一个名为“employee.txt”的文本文件中,这个文件可以长期保存在磁盘上,方便后续查询和修改。
图片来源于网络,如有侵权联系删除
(二)有了专门的文件管理软件
操作系统中的文件管理系统承担了文件管理的任务,它负责文件的存储空间分配、文件目录管理等功能,文件管理系统将磁盘空间划分为一个个的物理块,根据文件的大小分配相应数量的物理块来存储文件内容,它建立了文件目录结构,如树形目录结构,方便用户对文件进行分类管理和查找,以企业的文件管理为例,不同部门(如人事部门、财务部门)可以在不同的目录下创建自己的文件,提高了文件管理的效率。
(三)数据共享性差、冗余度大
虽然文件系统比人工管理阶段有了进步,但仍然存在诸多问题,在文件系统中,文件仍然是面向特定应用的,人事部门有一个员工基本信息文件,财务部门可能又有一个包含部分员工信息(如工资相关信息)的文件,这两个文件中的部分数据(如员工姓名、工号等)是重复的,造成了数据冗余,由于文件的格式和结构是由各个应用程序自己定义的,不同部门之间的数据共享变得困难,如果财务部门想要获取人事部门文件中的一些额外信息,往往需要进行复杂的数据转换和整合工作。
三、数据库系统阶段
现代信息技术的飞速发展促使数据管理进入数据库系统阶段,这是一个质的飞跃。
(一)数据结构化
数据库系统采用了复杂的数据模型(如关系模型、层次模型、网状模型等)来组织数据,其中关系模型最为流行,在关系数据库中,数据以表的形式存在,表由行(记录)和列(字段)组成,在一个企业资源管理数据库中,有员工表(包含员工编号、姓名、部门等字段)、订单表(包含订单编号、客户编号、订单金额等字段)等,这些表之间通过一定的关系(如外键关系)相互关联,这种结构化的数据组织方式使得数据的存储和管理更加规范、高效。
图片来源于网络,如有侵权联系删除
(二)数据共享性高、冗余度低
数据库系统的设计初衷就是为了实现数据的共享,多个用户或应用程序可以同时访问数据库中的数据,由于数据的结构化和规范化,数据的冗余度大大降低,在企业管理中,不同部门(如销售、生产、财务等)都可以访问员工表中的信息,而不需要各自维护一份员工数据副本,这样不仅节省了存储空间,而且提高了数据的一致性,当员工的基本信息发生变化时,只需要在数据库中的员工表中修改一次,所有相关部门获取到的都是更新后的数据。
(三)有专门的数据库管理系统(DBMS)
DBMS是数据库系统的核心软件,它负责对数据库进行统一的管理和控制,DBMS提供了数据定义语言(DDL)来创建和定义数据库的结构,如创建表、定义字段类型等;提供了数据操纵语言(DML)来对数据库中的数据进行查询、插入、删除和修改操作,如使用SQL(结构化查询语言)进行数据查询,DBMS还具备数据安全性管理(如用户权限设置)、数据完整性约束(如保证字段值的唯一性)、并发控制(确保多个用户同时访问数据库时的数据正确性)等功能。
(四)数据独立性强
数据库系统中的数据独立性包括物理独立性和逻辑独立性,物理独立性是指数据的物理存储结构(如存储在磁盘上的文件组织方式)的改变不会影响到应用程序对数据的使用,数据库管理员可以将数据库从一个磁盘阵列迁移到另一个磁盘阵列,而应用程序不需要做任何修改,逻辑独立性是指数据库的逻辑结构(如增加新的表或者修改表之间的关系)的改变不会影响到应用程序,这使得数据库系统在面对不断变化的业务需求时,能够灵活地进行调整,而不会对上层的应用程序造成大规模的破坏。
随着时代的发展,数据库系统还在不断演进,从传统的关系数据库到如今的分布式数据库、NoSQL数据库以及新兴的区块链数据库等,数据管理技术一直在适应着不断增长的数据量、多样化的数据类型和复杂的应用场景的需求,在大数据时代,数据管理技术将继续发挥着至关重要的作用,为人工智能、物联网等前沿技术提供坚实的数据基础。
评论列表