数据与文件组织-cuda ebook
1.3 数据与文件组织
数据是现实世界中信息的载体,是信息的具体表达形式。为了表达有意义的信息内容,数据必须按照一定的方式进行组织和存储。
1.3.1 数据组织的分级
数据库中的数据组织一般可以分为四级:数据项、记录、文件和数据库。
1) 数据项是可以定义数据的小单位,也叫元素、基本项、字段等,数据项与现实世界实体的属性相对应,数据项有一定的取值范围,称为域,域以外的任何值对该数据项都是无意义的。每个数据项都有一个名称,称为数据项目。数据项的值可以是数值的、字母数字的、汉字的等形式。数据项的物理特点在于它具有确定的物理长度,可以作为整体看待。
2) 记录是由若干相关联的数据项组成,是处理和存储信息的基本单位,是关于一个实体的数据总和,构成该记录的数据项表示实体的若干属性。记录有“型”和“值”的区别,“型”是同类记录的框架,它定义记录;而“值”是记录反映实体的内容。为了唯一标识每个记录,就必须有记录标识符,也叫关键字。记录标识符一般由记录中的第一个数据项担任,唯一标识记录的关键字称主关键字,其它标识记录的关键字称为辅关键字。记录可以分为逻辑记录与物理记录,逻辑记录是文件中按信息在逻辑上的独立意义来划分的数据单位;而物理记录是单个输入输出命令进行数据存取的基本单元。物理记录和逻辑记录之间的对应关系有一个物理记录一对应一个逻辑记录;一个物理记录含有若干个逻辑记录;若干个物理记录存放一个逻辑记录。
3) 文件是一给定类型的(逻辑)记录的全部具体值的集合,文件用文件名称标识,文件根据记录的组织方式和存取方法可以分为:顺序文件、索引文件、直接文件和倒排文件等。
4) 数据库是比文件更大的数据组织,数据库是具有特定联系的数据的集合,也可以看成是具有特定联系的多种类型的记录的集合。数据库的内部构造是文件的集合,这些文件之间存在某种联系,不能孤立存在。
1.3.2 数据间的逻辑联系
主要是指记录与记录之间的联系。记录是表示现实世界中的实体的。实体之间存在着一种或多种联系,这样的联系必然要反映到记录之间的联系上来。数据之间的逻辑联系主要有三种:一对一的联系;一对多的联系;多对多的联系。
想更深入了解文件组织的多样性?可以参考这些资源:多文件组织、shp文件组织结构、Linux系统核心源程序的文件组织结构。它们不仅涵盖了文件的具体组织形式,还涉及了如何在不同环境和系统中有效地管理和存储数据。真是令人着迷的数据世界!
(删除总结性结尾部分,直接切换至下一个主题或段落,增加阅读的连贯性和趣味性)