重复数据删除(英語:data deduplication)是一种节约数据存储空间的技术。在计算机中存储了很多重复数据,这些数据占用了大量硬盘空间,利用重复数据删除技术,可以只存储一份数据。另外一项节约存储空间的技术是数据压缩,数据压缩技术在比较小的范围内以比较小的粒度查找重复数据...
6 KB (731 words) - 10:03, 16 September 2023
備份 (category 数据管理)
重复数据删除技术可以发生在服务器端,在数据备份到存储之前执行,这种方法可以在节省存储空间的同时节省备份数据的带宽需求,这种方式的重复数据删除叫做在线即时数据处理(inline);重复数据删除技术也可以发生在存储设备端,称之为后台重复数据删除技术。 数据...
5 KB (825 words) - 03:53, 2 August 2023
分块 (计算机) (section 在重复数据删除、数据同步和远程数据压缩等方面)
一种能力,允许将不方便的大消息分解成更便于使用的小“块”。 在重复数据删除、数据同步和远端数据压缩中,分块是通过分块算法将文件分割成更小块的过程。它可以帮助消除存储上重复数据的重复拷贝,或者通过只选择被更改的块来减少通过网络上发送的数据量。诸如旋转哈希及其变种的基于内容分块算法(英语:Content-Defined...
2 KB (296 words) - 03:38, 21 December 2020
Proxmox Backup Server (category 维基共享资源分类链接由维基数据提供)
Backup Server授權條款為GNU Affero通用公共许可证第三版。 Proxmox Backup Server主要使用Rust編寫而成並實作了重复数据删除以減少所需的儲存空間。資料被分割為區塊。 Proxmox Backup Server的開發是從2018年10月開始的,目標是為虛擬化平台Proxmox...
9 KB (779 words) - 21:38, 13 November 2023
15起,支持块层面的重复数据删除 自Linux 5.16起,多设备支持多层容器映像 自Linux 5.17起,支持尾部打包(Ztailpacking),节省更多的磁盘空间和尾部I/O 自 Linux 5.19 起,基于文件的Fscache后端支持“按需模式” 自Linux 6.1起,支持滚动哈希重复数据删除和碎片化...
9 KB (711 words) - 14:24, 10 November 2023
某些NTFS功能在ReFS的初始版本中已移除或不支持。这包括备用数据流、对象ID、8.3文件名、NTFS压缩、加密文件系统(EFS)、事务性NTFS(英语:Transactional_NTFS)、硬链接、扩展属性和磁盘配额(英语:Disk_quota)。ReFS最初不提供重复数据删除,在随后的v3...
21 KB (1,858 words) - 02:46, 13 April 2025
写入放大 (category 维基共享资源分类链接由维基数据提供)
就已经收集好了所有的空闲区块,那么就可以直接写入主控要写入的新数据,而無須先移動数据,这样驱动器就总能表现出最佳性能。不幸的是,实际上某些區块上的数据主控并不需要,它们最终将会被删除,但操作系统并没有告诉控制器这些信息。结果,要被删除的数据被重写到了闪存的另一个位置,因而提高了写入放大。在一些OCZ...
41 KB (4,332 words) - 23:03, 4 November 2024
DSM)。毕业后任教于普林斯顿大学,并成为该校计算机系终身教授。2001年合伙在美国硅谷共同建立了(英語:Data Domain)公司,研制出世界上第一款商用重复数据删除产品,后来被易安信公司(EMC)收购。 2012年2月8日当选美国国家工程院院士。 专访美国工程院院士李凯:科研和创新不是一回事. 科学网. 2015-01-05...
3 KB (310 words) - 08:31, 27 August 2024
artner公司的估計,2008年產值為10億美元,至2014年則成長至44億美元 。 廣域網路優化的主要對象是針對於以TCP協定傳送的資料。 重复数据删除 压缩 延迟优化 缓存/代理 前向纠错 协议欺骗 流量整形 均化 连接限制 速率限制 Machowinski, Matthias. WAN optimization...
1 KB (144 words) - 08:06, 8 October 2020
数据。 虽然直接映射方式比B+树的查找速度快,但是这种方式的缺点也非常明显,如:元数据开销过大、顺序IO的大文件性能不好、删除比较慢等等,因此在现代文件系统中映射方式逐渐被extent变长块取代。 如果数据压缩(LZJB)被启用,可变块大小需要被用到。如果一个数据块可被压缩至一个更小的数据...
14 KB (1,875 words) - 16:47, 14 February 2025
达雷尔·朗 (category 本地相关图片与维基数据不同)
Maltzahn教授的指导下设计和实现。 朗也在超级计算机(exascale)文件系统的元数据和文件系统的安全性方面做了进一步的研究。 朗曾从事重复数据删除工作,曾致力于重复数据删除和增量压缩以减少备份和长期数据存储的存储需求。 他还为超大型备份系统的扩展重复数据删除技术做出了贡献。 除了这些领域之外,朗还撰写了关于网络缓存,移动计算中的功率感知硬盘管理以及...
15 KB (1,448 words) - 08:34, 1 April 2024
虽然在很久之前人们就开始常识对所有的渠道进行整合,诸如单源发布和响应式网页设计,然而我们通常关注的是内部效率、格式一致性和简单的跨通道重复数据删除。随着渠道数量的激增,当顾客使用多个渠道时,这些渠道之间可能出现脱节。除了传统的物理和人类交互渠道,其他渠道包括移动设备、移动互联网、移动应用程...
4 KB (382 words) - 03:53, 1 April 2022
关联数组 (category 数据结构)
Array),又称映射(Map)、字典(Dictionary)是一个抽象的数据结构,它包含着类似于(键,值)的有序对。一个关联数组中的有序对可以重复(如C++中的multimap)也可以不重复(如C++中的map)。 这种数据结构包含以下几种常见的操作: 向关联数组添加配对 从关联数组内删除配对 修改关联数组内的配对 根据已知的键寻找配对...
13 KB (1,692 words) - 22:28, 3 February 2025
约80%的代码。但截至2021年12月,块层缓存功能已从Bcachefs删除。 在数据结构层面,Bcachefs使用像许多其他现代文件系统一样的B树,但节点大小很大,默认为256 KiB。这些节点内部是日志结构的,形成混合数据结构,减少了更新时重写节点的需求。快照不是通过克隆COW树来实现的,而是...
7 KB (704 words) - 07:31, 9 April 2025
B树 (category 数据库索引技术)
B树(英語:B-tree),是一种在计算机科学自平衡的树,能够保持数据有序。這種資料結構能夠讓查找數據、顺序访问、插入數據及刪除的動作,都在對數時間內完成。B树,概括来说是一个一般化的二元搜尋樹,而每個節點可以拥有2个以上的子节点。与自平衡二叉查找树不同,B树适用于读写相对大的数据块的存储系统,例如磁盘。B树减少定位记录时...
26 KB (4,884 words) - 13:01, 8 June 2025
DDFS(英语:DDFS) – Data Domain File System,重复数据删除文件系统搭载于在Data Domain重复数据删除存储系统中,它是一个替代存储备份磁带和存档的系统。 DTFS(英语:Desktop File System) – Desktop...
52 KB (6,293 words) - 09:24, 24 February 2025
刪除等操作。 所謂「資料庫」是以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。一个数据库由多个表空间(Tablespace)构成。 在操作系统出现之后,随着计算机应用范围的扩大、需要处理的数据迅速膨胀。最初,数据...
11 KB (1,555 words) - 20:22, 19 September 2024
重复内容。 但是互联网的资源卷帙浩繁,这也意味着网络爬虫只能在一定时间内下载有限数量的网页,因此它需要衡量優先順序的下载方式。有時候網頁出現、更新和消失的速度很快,也就是說网络爬虫下载的网页在幾秒後就已经被修改或甚至删除了。这些都是网络爬虫设计師们所面临的两个问题。...
12 KB (1,916 words) - 01:05, 10 January 2025
事务中的操作只能是插入数据、修改数据以及删除数据,在事务过程中执行的其它操作不会纳入事务范畴,也就是说事务回滚时非事务操作不会被执行回滚。如果一个表或表空间中有数据涉及事务操作,则该表或表空间不允许被删除。 SequoiaDB支持多种开发语言,包括:C,C++,C#,Java,PHP,Python...
4 KB (476 words) - 17:42, 11 February 2025
OpenZFS (category 维基百科和维基数据上的官方网站不同)
256兆Yobibytes(2128位元組) 功能 岔流 是(稱為扩展文件属性) 属性 POSIX 文件系统权限 POSIX, NFSv4 ACLs 透明压缩 是 透明加密 是 重复数据删除 是 寫入時複製 是 操作系统支持 illumos散佈版、FreeBSD與其衍生版、macOS、透過可載入核心模組支援的ZFS on Linux、Microsoft...
3 KB (115 words) - 23:40, 21 November 2023
集合运算可能产生表示不确定信息的结果。在Codd的1979年提案中(该提案基本被SQL92采纳),这种语义上的不一致被合理化了,他认为在集合操作中删除重复的操作发生在 "比检索操作求值中的相等验证更低的细节层次上"。 然而,计算机科学教授Ron van der...
25 KB (3,022 words) - 07:31, 26 November 2022
散列表应当提供删除键值对的功能。然而,單純地清空对应的单元是不夠的。這會影響到對於儲存時間早於該單元、但儲存位置在該單元之後的其他鍵。此單元會造成搜索獲得錯誤的結果,告訴使用者這些鍵並不存在。 相较于直接清空对应单元i,更好的做法是先清空,然后把它之后所有会造成问题的单元向前移动,来避免搜索出错。重複...
7 KB (1,040 words) - 10:22, 28 November 2024
0於2009年5月25日發佈,基於Ubuntu 8.04 "Hardy Heron" LTS。 NexentaCP 3.0 Alpha2(不穩定版本),支持重複數據刪除技術。 NexentaCP 1.0於2007年10月16日發佈。 Milek's blog. [2010-01-12]. (原始内容存档于2008-09-25)...
3 KB (251 words) - 15:06, 21 March 2024
民共和国水利部发布的《中国湖泊名称代码》(SL261-98)和中国湖泊科学数据库等数据基本吻合,因此该数据大体上仍然较为可信。本列表即以《中国湖泊志》中的数据为基础,删除了坐标错误(位置不明)、重复记录及内蒙古自治区以外的数据,并增加了未收录的红碱淖、九连城淖尔等湖泊。湖泊名称参照天地图、《中国河湖...
118 KB (481 words) - 03:12, 4 July 2024
电脑设备或其他数字随机存取的方式剪辑。与过去需要两台以上的录像机,从不同的磁带合成到一盘磁带的线性编辑方式相比,能立即重新排列、替换、增加、删除、修改映像数据,以达到快速编辑的目标。 1990年代,随着个人电脑运算能力的提升和普及,非线性已經走入家庭或個人使用普遍应用。 常用的非线性剪辑的電腦软件有Adobe...
4 KB (633 words) - 14:30, 1 September 2024
者通过「关联」作用被联想在一起的資訊会被输送到中长期记忆。不重要的資訊会被删除。 记忆内容越是被频繁读取,或是一种运动被频繁重复进行,回馈就越是精细,内容所得的评价会提高,或是运动被优化。后面一点的意思是,不重要的資訊会被删除,或是另存到其他位置。记忆的深度一方面和该内容与其他内容的连接数目,另一方面与情感对之的评价有关。...
11 KB (1,593 words) - 11:09, 4 May 2025
数据挖掘(英語:Data mining)是一个跨学科的计算机科学分支 。它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。除了原始分析步骤,它还涉及到数据库和数据管理方面、数据预处理(英语:data...
19 KB (2,578 words) - 11:11, 12 December 2024
www-form-urlencoded的编码方式对于文件这种二进制的数据非常低效。 PUT 向指定资源位置上传其最新内容。 DELETE 请求服务器删除Request-URI所标识的资源。 TRACE 回显服务器收到的请求,主要用于测试或诊断。 OPTIONS...
18 KB (2,327 words) - 13:58, 15 March 2025
DVD+R以資料儲存為主,影音效果較差。 DVD-R可燒錄影音。 DVD-RW可重復燒錄、刪除;以影音燒錄為主。 DVD-RAM可重復燒錄、刪除;以資料儲存為主。 DVD+RW可重復燒錄、刪除;可儲存資料或影音媒體。 BD-R可燒錄影音和資料儲存。 BD-RE可重復燒錄、刪除。 非工业的光碟刻录硬件可以包括消费者采用的刻录机。...
2 KB (250 words) - 04:57, 28 April 2023
集群文件系统 (category 数据管理)
视图,即使多个客户机试图同时访问相同的文件,也能避免损坏和意外的数据丢失。共享磁盘文件系统通常采用某种隔离机制,以防止在节点故障时出现数据损坏,因为非隔离设备如果失去与其姐妹节点的通信并试图访问其他节点正在访问的相同信息,就可能导致数据损坏。底层存储区域网络可以使用任何一种块级协议,包括SCSI、iSCSI、HyperSCSI、ATA...
16 KB (2,004 words) - 11:07, 12 December 2024
重复和抽象反演(英语:Abstraction inversion)。尤其是将DAO作为常规Java对象的抽象会隐藏每个数据库访问的高成本,并且可能强迫开发人员触发多个数据库查询来检索普通SQL查询中一次就可取回的信息。如果一个应用程序需要多个DAO,人们可能发现自己对每个DAO重复...
5 KB (715 words) - 20:00, 17 July 2022