结构化数据和非结构化数据的区别

如题所述

结构化数据和非结构化数据的区别:定义不同、来源不同、形式不同、模型不同、存储不同。

1、定义不同

结构化数据:结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。

非结构化数据:非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、XML,HTML、各类报表、图像和音频/视频信息等。

2、来源不同

结构化数据:结构化数据源来自GPS传感器、在线表单、网络日志、Web服务器日志、OLTP系统等。

非结构化数据:非结构化数据源包括电子邮件、文字处理文档、PDF文件等。

3、形式不同

结构化数据:结构化数据由数字和值组成。

非结构化数据:非结构化数据由传感器、文本文件、音频和视频文件等组成。

4、模型不同

结构化数据:结构化数据具有预定义的数据模型,并且在放入数据存储(例如,写入时模式)之前被格式化为设定的数据结构。

非结构化数据:非结构化数据则以其本机格式存储,并且在使用之前不会进行处理(例如,读取时模式)。

5、存储不同

结构化数据:结构化数据以表格格式(例如,Excel工作表或SQL数据库)存储,需要较少的存储空间。它可以存储在数据仓库中,这使其具有高度的可扩展性。

非结构化数据:非结构化数据存储为媒体文件或NoSQL数据库,这需要更多的空间。它可以存储在数据湖中,这使得它难以扩展。

温馨提示:答案为网友推荐,仅供参考