《数据管理技术发展的三个阶段:从原始到智能的演进》
一、人工管理阶段
(一)数据不保存或简单保存
在数据管理技术发展的早期,即人工管理阶段,计算机主要用于科学计算,当时,数据不被重视保存,或者只是进行简单的保存,计算任务一结束,数据就可能被丢弃,因为计算机资源非常有限,重点在于计算过程本身,如果有保存数据的需求,也只是以简单的文件形式存在,缺乏系统性的管理,这一时期的数据与程序紧密结合,数据通常直接包含在程序代码中,程序员在编写程序时,要同时考虑数据的定义、存储结构和操作逻辑,如果数据结构发生变化,例如从一个数组结构变成链表结构,那么整个程序都需要进行修改。
图片来源于网络,如有侵权联系删除
(二)没有专门的软件对数据进行管理
由于缺乏专门的数据管理软件,数据的管理完全依赖于程序员自身,这意味着在数据的存储方面,程序员需要精确地指定数据在存储设备中的位置,比如在磁带或者早期的磁盘上的具体存储地址,在数据的访问方面,也只能通过程序中硬编码的方式来实现,要读取一组实验数据,程序员需要在程序中明确写出数据在存储介质中的起始位置、读取的长度等信息,这种方式效率极低且极易出错,一旦数据的存储位置发生变动,程序就无法正确读取数据,不同的程序之间无法共享数据,每个程序都有自己独立的数据定义和操作方式,数据的冗余度极高,在一个科研机构中,不同的研究小组可能对相同的实验对象进行研究,但是由于没有共享数据的机制,每个小组都要独立存储和管理自己的数据,这不仅浪费了大量的存储空间,也使得数据的一致性难以保证。
(三)数据面向应用
这个阶段的数据是面向特定应用程序的,数据的组织方式完全取决于应用程序的需求,一个用于计算员工工资的程序,它的数据结构可能是按照员工的基本信息(姓名、工号、部门等)和工资相关信息(基本工资、津贴、扣除项等)这样一种简单的表格形式组织起来的,这种数据组织方式只适用于这个特定的工资计算程序,如果要将这些数据用于其他用途,如人力资源统计分析,就非常困难,因为数据的结构和含义是紧密绑定在特定应用程序中的,缺乏通用性和灵活性。
二、文件系统阶段
(一)数据以文件形式长期保存
随着计算机技术的发展,进入到文件系统阶段,在这个阶段,数据可以以文件的形式长期保存下来,文件系统为数据提供了一种相对统一的存储和管理方式,用户可以通过文件名来标识和访问数据文件,在一个企业的办公环境中,各种文档、报表等都可以以文件的形式存储在计算机的磁盘上,这些文件可以根据不同的类型(如文本文件、电子表格文件等)和用途进行分类存储,方便用户查找和使用,文件系统提供了基本的文件操作功能,如创建、删除、修改和读取文件等。
图片来源于网络,如有侵权联系删除
(二)有专门的软件管理文件
专门的文件管理软件应运而生,这大大提高了数据管理的效率,操作系统中的文件系统负责管理文件的存储、检索和安全保护等功能,文件系统将磁盘空间划分为不同的区域,用于存储文件的元数据(如文件名、文件大小、创建时间等)和文件内容,在常见的Windows操作系统中,NTFS文件系统通过主文件表(MFT)来管理文件的各种信息,文件管理软件还提供了文件的目录结构,用户可以按照层次结构来组织文件,可以创建不同的文件夹来存放不同部门的文件,在部门文件夹下再创建子文件夹来存放不同类型的文件,这种目录结构使得数据的管理更加有序。
(三)数据共享性差、冗余度大
文件系统阶段的数据共享性仍然较差,虽然文件可以被多个程序访问,但是由于文件的格式和内容是由创建者定义的,不同程序对文件的理解和使用方式可能不同,一个财务软件生成的财务报表文件,可能采用了特定的格式和编码方式,其他的分析软件可能无法直接读取和分析其中的数据,需要进行格式转换等操作,数据冗余度大的问题依然存在,由于文件是独立存在的,不同的文件可能包含相同的数据内容,在一个企业中,销售部门和市场部门可能都保存了客户的基本信息文件,当客户信息发生变化时,就需要在两个文件中分别进行修改,容易导致数据不一致。
三、数据库系统阶段
(一)数据结构化存储
数据库系统阶段的一个重要特征是数据的结构化存储,数据库采用特定的数据模型(如关系模型、层次模型、网状模型等)来组织数据,以关系数据库为例,数据被组织成二维表的形式,表中的每一行代表一个实体,每一列代表实体的一个属性,这种结构化的存储方式使得数据更加规范化、易于理解和管理,在一个电商企业的数据库中,有用户表(包含用户ID、姓名、联系方式等属性)、商品表(包含商品ID、名称、价格等属性)和订单表(包含订单ID、用户ID、商品ID、订单时间等属性)等,这些表之间通过特定的关系(如外键关系)相互关联,从而可以方便地进行数据的查询、更新和删除操作。
图片来源于网络,如有侵权联系删除
(二)数据共享性高、冗余度低
数据库系统提供了高度的数据共享性,多个用户和应用程序可以同时访问数据库中的数据,并且可以根据不同的权限对数据进行操作,在一个企业资源规划(ERP)系统中,财务部门、生产部门、销售部门等都可以访问和使用数据库中的数据,生产部门可以查询库存数据来安排生产计划,销售部门可以查询产品信息和客户信息来进行销售活动,而财务部门可以根据销售数据和生产数据进行成本核算和财务管理,由于数据是集中存储和管理的,数据库系统通过规范化的数据设计,可以大大降低数据的冗余度,在上述电商企业的数据库中,客户的基本信息只需要在用户表中存储一次,而在订单表中只需要引用用户表中的用户ID即可,避免了重复存储客户信息。
(三)有专门的数据库管理系统(DBMS)
专门的数据库管理系统(DBMS)负责数据库的创建、维护和管理,DBMS提供了一系列的功能,如数据定义语言(DDL)用于创建和修改数据库的结构(如创建表、定义列的数据类型等),数据操纵语言(DML)用于对数据库中的数据进行操作(如插入、查询、更新和删除数据等),以及数据控制语言(DCL)用于管理数据库的访问权限(如授予或撤销用户对数据库的操作权限等),DBMS还提供了数据的安全性、完整性和并发控制等功能,DBMS可以通过设置用户密码、加密数据等方式来保证数据的安全性;通过定义约束条件(如主键约束、外键约束等)来保证数据的完整性;通过并发控制机制(如锁机制)来处理多个用户同时访问数据库时可能出现的冲突问题。
从人工管理阶段到文件系统阶段再到数据库系统阶段,数据管理技术不断发展进步,在数据的保存、管理、共享、冗余控制等方面都有了质的飞跃,为现代信息社会的海量数据管理和应用奠定了坚实的基础。
评论列表