需要帮助!无法解决这个问题,我遇到了硬件限制 - 页 10

 

我再试一次。

我们有三个文件。

1.L.托尔斯泰。战争与和平》第一卷。

2.L.托尔斯泰。战争与和平》第二卷。

3.F. 陀思妥耶夫斯基。罪与罚》。

我们为他们每个人打包。

我们有三个没有名字的打包文件(只是不要问我如何想象一个没有名字的文件)。我们也有一个非包装文件,就让它成为 "罪与罚"。

如何以最经济的方式在三个压缩文件中找到这个文件?

选项1:我需要压缩所有三个文件并找到我正在寻找的文件。

选项2。压缩你要找的文件,在三个压缩的文件中找到完全相同的文件。

 
YuraZ:

这不是我的建议。在任何情况下,这是一个有趣的想法。
 
Integer:
是的,我知道,如果数据很短,归档时大小会增加。

如果你想继续朝这个方向发展,你也可以使用散列或校验来搜索,你不必使用压缩编码。创建一个哈希索引并通过二分法搜索。

但这是在来源部分有全尺寸的情况下。

例如,在这种情况下,我使用DBMS,没有任何花招。我花在开发上的时间更少,产品也很稳定。

 

你们说的都是对的,这再一次强调了压缩选项应该是合理的任务。

你必须依靠问题陈述。

 
elugovoy:

如果你想继续朝这个方向发展,你也可以使用散列或校验来搜索,你不必使用压缩编码。创建一个哈希索引并通过二分法搜索。

但这是在来源部分有全尺寸的情况下。

例如,在这种情况下,我使用DBMS,没有任何花招。我花在开发上的时间更少,而且产品很稳定。

好主意。
 
Integer:
所以这不是我的建议。无论如何,这个想法是有趣的。

>> 谈到比较两个压缩的序列。

迪马!提醒我--这就是我们谈论的内容。

>> 这正是我们在实践中讨论的。

>> 是的,我知道,如果数据很短,归档时就会增加大小。

>>这就是为什么它没有用的原因

--

这就是为什么工业数据库没有这种意识形态。

...

 
elugovoy:

Ну если хотите продолжать в этом направлении, то для поиска можно и хеширование использовать или контрольную сумму, не обязательно кодировать сжатием. Создать индекс по хешам и методом дихотомии выполнять поиск.

Но это при наличии исходной порции в полном объеме.

Я например, в подобных случаях использую СУБД без всяких выкрутасов. И времени меньше затрачиваю на разработку, и продукт стабильный получается.

整数

好主意。

你可以试试

>> 例如,在这种情况下,我使用DBMS ,没有任何花招。它的开发时间较短,而且产品很稳定。

但最好是使用一个现成的工业SQL数据库

 
YuraZ:

>> 谈到比较两个压缩的序列。

迪马!提醒我--这就是我们正在谈论的东西

>> 这正是我们在实践中讨论的。

>> 是的,我知道,如果数据很短,在归档时就会增加尺寸。

>>这就是为什么它没有用的原因

--

这就是为什么工业基地也没有这种意识形态的原因

...

我认为这是另一个原因。因为在那里,将大数据加载到纲要中的问题得到了不同的解决,它们不是被加载,而是直接从磁盘中读取。(大概)
 
YuraZ:

你可以试试

>> 例如我,在这种情况下,使用一个 没有任何技巧 的DBMS。我花在开发上的时间更少,而且产品很稳定。

但最好是使用现成的工业SQL数据库

Yurichik,我的意思是没有任何曲折的文件处理、压缩等。我的意思是只用SQL和机器人/指示器逻辑工作。我与许多数据库合作,唯一的问题是使MQL和SQL一起工作))。 我创建了一个漂亮的解决方案,没有数组和结构。

一般来说,我不喜欢重新发明轮子,而是用最好的手段解决问题。

 
Integer:
我认为这是另一个原因。因为在那里以不同的方式解决了向操作系统加载大数据的问题,它们不是被加载,而是直接从磁盘上读取。(我猜)

服务器会做...非常有效。