当前位置:网站首页 > 大数据架构 > 正文

存储工程师面试题目(存储工程师面试题目大全)



磁盘阵列、硬盘

块存储主要是将裸磁盘空间整个映射给主机使用的,就是说例如磁盘阵列里面有3块硬盘,然后可以通过划逻辑盘、做Raid、或者LVM(逻辑卷)等种种方式逻辑划分出N个逻辑的硬盘,且是由多个物理硬盘逻辑虚构出来的。

接着块存储会采用映射的方式将这几个逻辑盘映射给主机,主机上面的操作系统会识别到有3块硬盘,但是操作系统是区分不出到底是逻辑还是物理的,这跟直接拿一块物理硬盘挂载到操作系统没有区别的。

此种方式下,操作系统还需要对挂载的裸硬盘进行分区、格式化后,才能使用,与平常主机内置硬盘的方式完全无异。

1、DAS(Direct Attach Storage)

DAS是直接连接于主机服务器的一种存储方式,每台服务器有独立的存储设备,每台主机服务器的存储设备无法互通,需要跨主机存取资料室,必须经过相对复杂的设定若主机分属不同的操作系统,则更复杂。

应用:单一网络环境下且数据交换量不大,性能要求不高的环境技术实现较早。

2、SAN(Storage Area Network)

SAN是一种高速(光纤)网络联接专业主机服务器的一种存储方式,此系统会位于主机群的后端,它使用高速I/0 联接方式,如:SCSL,ESCON及 Fibre-Channels.特点是,代价高、性能好。但是由于 SAN 系统的价格较高,且可扩展性较差,已不能满足成千上万个 CPU 规模的系统。

应用:对网速要求高、对数据可靠性和安全性要求高、对数据共享的性能要求高的应用环境中。

1、这种方式的好处当然是因为通过了 Raid 与 LVM 等手段,对数据提供了保护。

2、另外也可以将多块廉价的硬盘组合起来,成为一个大容量的逻辑盘对外提供服务,提高了容量。

3、写入数据的时候,由于是多块磁盘组合出来的逻辑盘,所以几块磁盘可以并行写入的,提升了读写效率。

4、很多时候块存储采用 SAN 架构组网,传输速率以及封装协议的原因,使得传输速度与读写速率得到提升。

1、采用 SAN 架构组网时,需要额外为主机购买光纤通道卡,还要买光纤交换机,造价成本高。

2、主机之间的数据无法共享,在服务器不做集群的情况下,块存储裸盘映射给主机,再格式化使用后,对于主机来说相当于本地盘那么主机 A的本地盘根本不能给主机 B 去使用,无法共享数据,3)不利于不同操作系统主机间的数据共享:另外一个原因是因为操作系统使用不同的文件系统,格式化完之后,不同文件系统间的数据是共享不了的。

FTP、NFS 服务器

文件存储很好的规避了块存储不利于分享的缺点,而且通常 NAS产品都是文件级存储。

主机 A 可以直接对文件存储进行文件的上传下载,与块存储不同主机 A是不需要再对文件存储进行格式化的,因为文件管理功能已经由文件存储自己处理。

文件存储是指将数据以文件的形式保存在计算机系统或其他存储设备中的一种分层存储方法。它将数据保存于文件和文件夹中。数据的存储和检索需要您或计算机系统知道路径:从目录到子目录到文件夹最后找到文件。文件可以包括各种数据类型,例如文本文档、图片、音频文件等。管理和存储文件信息的软件机构称为文件管理系统,简称文件系统。文件系统具体负责为用户建立文件、存入、读出、修改、转存,并维护文件的属性(如名称、大小和创建日期)和内容。文件存储可以根据数据的存放位置分为两大类:本地存储和远程存储。

1、本地文件存储

本地文件存储涉及将文件直接保存到用户直接控制的设备,如内置硬盘、外接USB驱动器、SSD等。这种方法优点在于提供快速的访问速度和较高的数据安全性,因为数据物理上靠近用户,便于管理和备份。本地文件系统为用户提供了一种方便的方式来组织和访问这些文件,通过数据块的形式存储文件并允许用户通过图形界面或命令行工具来进行文件管理。

2、远程文件存储

相反,远程文件存储则涉及将文件放置在网络上某个位置,如云存储服务或FTP服务器上。这种模式的优势在于便于文件共享、数据可进行集中管理、并且容易扩展存储容量。远程文件存储通常依赖于网络协议(例如FTP、SMB、NFS)来实现跨网络的文件访问和操作。云服务提供商使用其自定义的文件管理系统和协议来维护用户数据,并允许通过网络进行数据存取和协作。

NAS(Network Attached Storage):是一套网络存储设备,通常直接连在网络上并提供资料存取服务,一套 NAS 储存设备就如同一个提供数据文件服务的系统,特点是性价比高。

它采用 NFS 或 CIFS 命令集访问数据,以文件为传输协议,可扩展性好、价格便宜、用户易管理。目前在集群计算中应用较多的 NFS文件系统,但由于 NAS的协议开销高、带宽低、延迟大,不利于在高性能集群中应用。

1)造价较低:随便一台机器就可以了,另外普通以太网就可以根本不需要专用的 SAN 网络,所以造价低。

2)方便文件共享

读写速率低,传输速率慢:以太网,上传下载速度较慢,另外所有读写都要一台服务器里面的硬盘来承担,相比起磁盘阵列动不动就几十上百块硬盘同时读写,速率慢了许多。

内置大容量硬盘的分布式服务器、阿里云OSS、华为云OBS、腾讯云COS、百度云BOS

对象存储最常用的方案,就是多台服务器内置大容量硬盘,再装上对象存储软件,然后再加几台服务器作为管理节点,安装上对象存储管理软件。管理节点可以管理其他服务器对外提供读写访问功能。对象存储既克服块存储与文件存储各自的缺点,又继承了优点。

对象储存结构组成部分:对象、对象存储设备、元数据服务器对象存储系统的客户端。

一个文件包含了属性(术语叫matadata元数据,例如该文件的大小、修改时间、存储路径等)和内容(简称数据)。以往的文件系统,存储过程将文件按文件系统的最小块来打散,再写进硬盘,过程中没有区分元数据(metadata)和数据。而在每个块最后才会告知下一个块的地址,因此只能一个一个读,速度慢。而对象存储则将元数据独立出来,控制节点叫元数据服务器(服务器+对象存储管理软件),里面主要存储对象的属性(主要是对象的数据被打散存放到了那几台分布式服务器中的信息),而其他负责存储数据的分布式服务器叫做OSD,主要负责存储文件的数据部分。当用户访问对象时,会先访问元数据服务器,元数据服务器只负责反馈对象存储在那些 OSD。假设反馈文件A存储在B、C、D三台OSD万那么用户就会再次访问三台OSD服务器去读取数据。这时三台OSD同时对外传输数据,因此传输的速度就加快了。OSD服务器数量越多,这种读写速度的提升就越大。

另一方面,对象存储软件有专门的文件系统,所以OSD对外又相当于文件服务器,那么就不存在文件共享方面的困难了,也解决了文件共享方面的问题。所以对象存储的出现,很好地结合了块存储与文件存储的优点。

对象存储应用在各种场景下都有广泛的应用,包括但不限于:

1、大规模数据存储和分析:对象存储应用适用于存储和处理大规模的结构化和非结构化数据,如日志文件、图像、音视频等。

2、备份和灾难恢复:对象存储应用提供了可靠的数据备份和灾难恢复功能,保护数据免受硬件故障、自然灾害等风险。

3、多媒体存储和分发:对象存储应用可以存储和分发多媒体内容,如图片、音频和视频文件,适用于在线媒体、直播等应用。

4、云原生应用:对象存储应用是构建云原生应用的重要组成部分,可以与容器、微服务等技术结合,实现高效的应用开发和部署。

5、静态网站托管‌:可以作为静态网站的托管平台,存储网页和相关的静态资源,提供快速的访问和高可用性。

1、​‌可扩展性‌:对象存储系统能够轻松应对海量数据的存储需求,采用分布式架构,可以根据实际需求动态扩展存储容量,无需用户手动调整硬件设备。 

2、高可靠性‌:通过数据冗余和自动修复机制,确保数据的高可靠性。数据会被复制到不同的存储节点和设备上,即使发生硬件故障或数据损坏,仍能保证数据的完整性和可用性。 

3、高性能‌:具备高并发读写能力,能够处理大规模的数据访问请求。采用‌分级存储和‌智能缓存等技术,优化数据的访问效率,提供快速的数据传输和响应时间。 

4、数据安全‌:提供多种安全机制来保护数据的机密性和完整性。支持‌数据加密、‌访问控制和‌身份验证等功能,确保只有授权用户可以访问和修改数据。 

5、灵活性‌:支持多种数据访问方式,包括‌API接口、‌SDK和标准的‌HTTP/HTTPS协议等。用户可以根据自己的需求选择适合的访问方式,实现灵活的数据操作和管理。 

‌6、成本优化‌:相比传统存储方式,对象存储的存储成本通常更低。基于使用量付费的模型,用户可以根据实际需求逐渐增加存储容量,无需过度投资。 

7‌、易于管理‌:使用扁平的‌命名空间而不是传统的文件系统层次结构,管理海量数据变得更加简单。通过简单的API调用来存储和检索数据,简化管理和自动化。 

1‌、性能问题‌:对象存储在处理大量小文件时可能会遇到性能瓶颈。由于对象存储通常以对象为单位进行存储,每个对象都需要单独访问和传输,这会导致大量的I/O操作,从而影响整体性能‌。

‌2、成本问题‌:对象存储的成本相对较高,尤其是对于小文件存储。由于每个对象都需要单独存储和管理,这会导致存储空间的利用率较低,从而增加了单位数据的存储成本‌。

3、数据一致性和安全性问题‌:对象存储在数据一致性和安全性方面可能存在挑战。由于对象存储通常分布在多个服务器上,数据的一致性维护和同步可能较为复杂,且在数据丢失或损坏时恢复难度较大‌。

4、适用场景限制‌:对象存储适用于存储大量非结构化数据,如图片、视频和文档等。然而,对于需要频繁修改和更新的小文件或结构化数据,对象存储可能不是最佳选择‌。

5、元数据管理复杂‌:对象存储中的元数据管理相对复杂,需要额外的管理和维护工作。元数据的增加和维护可能会影响系统的整体性能和响应速度‌。

选择合适的存储解决方案需要根据具体需求进行分析,包括数据类型、数据量、访问模式、性能要求、扩展性需求、安全性要求等。

1、有一类应用是需要存储直接裸盘映射的,因为数据库需要存储裸盘映射给自己后,再根据自己的数据库文件系统来对裸盘进行格式化的,应用需要高性能的随机读写,如数据库存储、虚拟机存储、高性能计算等,可以选择块存储解决方案。块存储提供了高性能的随机访问和低延迟的数据读写,适合需要高吞吐量和低延迟的应用,所以是不能够采用其他已经被格式化为某种文件系统的存储的。此类应用更适合使用块存储。

2、如果应用需要方便的文件管理和共享,如个人文件存储、企业文件服务器、网络文件共享等,可以选择文件存储解决方案。文件存储提供了方便的文件访问接口和多种文件操作,适合日常文件管理和共享。

3、 如果应用需要大规模数据存储和高并发访问,如云存储服务、媒体存储和分发、备份和归档、大数据和分析等,可以选择对象存储解决方案。对象存储提供了良好的性能和扩展性,支持水平扩展和大规模并发访问,适合处理海量数据和高访问负载的应用,对象存储的成本比起普通的文件存储还是较高,需要购买专门的对象存储软件以及大容量硬盘。如果对数据量要求不是海量,只是为了做文件共享的时候,直接用文件存储的形式好了,性价比高。

4、如果更在意文件的传输速度,以及要具有良好的共享性,那应该选择对象存储,而且,这也是一种趋势。

  • 文件存储:以文件和目录结构存储数据,提供方便的文件访问接口,适合日常文件管理和共享。
  • 块存储:将数据分割成固定大小的块,通过块地址进行访问,支持高性能的随机读写,适合数据库、虚拟机等高性能应用。
  • 对象存储:将数据作为对象存储,每个对象包含数据、元数据和唯一标识符,支持大规模并发访问和复杂查询,适合云存储、媒体分发等应用。
  • 文件存储:文件系统管理文件和目录,元数据管理文件属性和位置,访问控制确保数据安全,提供多种文件操作接口。
  • 块存储:逻辑卷管理物理存储设备,块设备驱动处理数据读写,数据管理负责块的分配和复制,支持高性能随机访问。
  • 对象存储:分布式存储节点存储对象,对象管理层维护元数据和标识符,访问接口提供统一的访问方式,数据保护实现冗余和加密,支持大规模并发访问。
  • 文件存储:个人计算机、企业文件服务器、网络文件共享、备份和归档,适合日常文件管理和共享。
  • 块存储:数据库存储、虚拟机存储、高性能计算、容灾和备份,适合高性能和低延迟的数据访问。
  • 对象存储:云存储服务、媒体存储和分发、备份和归档、大数据和分析,适合海量数据和高并发访问。
  • 文件存储:文件存储在性能和扩展性方面受限于文件系统的设计和实现,适合中小规模的数据存储和访问。
  • 块存储:块存储具有较高的性能和扩展性,适合需要高吞吐量和低延迟的应用,但管理复杂度较高。
  • 对象存储:对象存储具有良好的性能和扩展性,支持水平扩展,适合大规模数据存储和高并发访问,管理和使用相对简单。
  • 文件存储:文件存储通过访问控制和权限管理来保护数据安全,文件系统提供数据的一致性和完整性保障。
  • 块存储:块存储通过数据冗余和备份来提高数据的可靠性,支持快速的数据恢复和迁移,确保数据的安全性。
  • 对象存储:对象存储通过数据冗余、加密和访问控制来保护数据安全,支持数据的冗余和分布,提高数据的可靠性和可用性。

         随着数据量的持续增长和应用需求的不断变化,数据存储技术也在不断发展。未来,数据存储技术将更加注重性能、扩展性、安全性和可靠性,以满足不断增长的数据存储和管理需求。

         云存储作为一种新兴的存储方式,已经成为数据存储的重要组成部分。未来,云存储将继续发展,提供更高的性能和可用性,支持更多的应用场景和数据类型,为用户提供更便捷和高效的数据存储服务。

         分布式存储作为一种高性能、高可靠的数据存储方式,已经在大数据和云计算领域得到广泛应用。未来,分布式存储将继续发展,提供更高的扩展性和可靠性,支持更多的数据存储和管理需求。

         文件存储、块存储和对象存储是三种主要的数据存储方式,它们各自具有独特的特性和适用场景。文件存储适合日常文件管理和共享,块存储适合高性能和低延迟的数据访问,而对象存储则适合处理海量数据和高并发访问。

         了解这三种存储方式的定义、架构、原理和应用场景,可以帮助我们在实际应用中选择最合适的数据存储解决方案。同时,随着数据存储技术的不断发展,未来将会有更多高性能、高可靠的数据存储解决方案出现,以满足不断增长的数据存储和管理需求。

到此这篇存储工程师面试题目(存储工程师面试题目大全)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • 工具类图书名称(工具类图书名称大全)2024-12-07 12:54:07
  • 时钟代码(时钟代码大全)2024-12-07 12:54:07
  • 泰拉瑞亚时间指令代码大全(泰拉瑞亚指令代码大全手游)2024-12-07 12:54:07
  • Cesium资料大全2024-12-07 12:54:07
  • Cesium实现坐标转换;目标区域放大2024-12-07 12:54:07
  • 字体图标怎么设置大小尺寸(图标字体怎么调大小)2024-12-07 12:54:07
  • ceph存储架构(cephrbd存储)2024-12-07 12:54:07
  • 芯片参数查询网(芯片查询大全)2024-12-07 12:54:07
  • 电脑好玩的代码(电脑好玩的代码大全)2024-12-07 12:54:07
  • 时钟代码大全(时钟配置代码)2024-12-07 12:54:07
  • 全屏图片