需要帮助!无法解决这个问题，我遇到了硬件限制

Dmitry Fedoseev 2014.08.18 13:53 #91

我再试一次。

我们有三个文件。

1.L.托尔斯泰。战争与和平》第一卷。

2.L.托尔斯泰。战争与和平》第二卷。

3.F. 陀思妥耶夫斯基。罪与罚》。

我们为他们每个人打包。

我们有三个没有名字的打包文件（只是不要问我如何想象一个没有名字的文件）。我们也有一个非包装文件，就让它成为 "罪与罚"。

如何以最经济的方式在三个压缩文件中找到这个文件？

选项1：我需要压缩所有三个文件并找到我正在寻找的文件。

选项2。压缩你要找的文件，在三个压缩的文件中找到完全相同的文件。

Dmitry Fedoseev 2014.08.18 13:53 #92

YuraZ:

这不是我的建议。在任何情况下，这是一个有趣的想法。

Eugeniy Lugovoy 2014.08.18 13:54 #93

Integer:
是的，我知道，如果数据很短，归档时大小会增加。

如果你想继续朝这个方向发展，你也可以使用散列或校验来搜索，你不必使用压缩编码。创建一个哈希索引并通过二分法搜索。

但这是在来源部分有全尺寸的情况下。

例如，在这种情况下，我使用DBMS，没有任何花招。我花在开发上的时间更少，产品也很稳定。

Mykola Demko 2014.08.18 13:56 #94

你们说的都是对的，这再一次强调了压缩选项应该是合理的任务。

你必须依靠问题陈述。

Dmitry Fedoseev 2014.08.18 13:56 #95

elugovoy:

如果你想继续朝这个方向发展，你也可以使用散列或校验来搜索，你不必使用压缩编码。创建一个哈希索引并通过二分法搜索。

但这是在来源部分有全尺寸的情况下。

例如，在这种情况下，我使用DBMS，没有任何花招。我花在开发上的时间更少，而且产品很稳定。

好主意。

Yuriy Zaytsev 2014.08.18 14:00 #96

Integer:
所以这不是我的建议。无论如何，这个想法是有趣的。

>> 谈到比较两个压缩的序列。

迪马！提醒我--这就是我们谈论的内容。

>> 这正是我们在实践中讨论的。

>> 是的，我知道，如果数据很短，归档时就会增加大小。

>>这就是为什么它没有用的原因

--

这就是为什么工业数据库没有这种意识形态。

...

Yuriy Zaytsev 2014.08.18 14:03 #97

elugovoy:

Ну если хотите продолжать в этом направлении, то для поиска можно и хеширование использовать или контрольную сумму, не обязательно кодировать сжатием. Создать индекс по хешам и методом дихотомии выполнять поиск.

Но это при наличии исходной порции в полном объеме.

Я например, в подобных случаях использую СУБД без всяких выкрутасов. И времени меньше затрачиваю на разработку, и продукт стабильный получается.

整数。

好主意。

你可以试试

>> 例如，在这种情况下，我使用DBMS ，没有任何花招。它的开发时间较短，而且产品很稳定。

但最好是使用一个现成的工业SQL数据库

Dmitry Fedoseev 2014.08.18 14:05 #98

YuraZ:

>> 谈到比较两个压缩的序列。

迪马！提醒我--这就是我们正在谈论的东西

>> 这正是我们在实践中讨论的。

>> 是的，我知道，如果数据很短，在归档时就会增加尺寸。

>>这就是为什么它没有用的原因

--

这就是为什么工业基地也没有这种意识形态的原因

...

我认为这是另一个原因。因为在那里，将大数据加载到纲要中的问题得到了不同的解决，它们不是被加载，而是直接从磁盘中读取。(大概)

Eugeniy Lugovoy 2014.08.18 14:20 #99

YuraZ:

你可以试试

>> 例如我，在这种情况下，使用一个 没有任何技巧 的DBMS。我花在开发上的时间更少，而且产品很稳定。

但最好是使用现成的工业SQL数据库

Yurichik，我的意思是没有任何曲折的文件处理、压缩等。我的意思是只用SQL和机器人/指示器逻辑工作。我与许多数据库合作，唯一的问题是使MQL和SQL一起工作））。我创建了一个漂亮的解决方案，没有数组和结构。

一般来说，我不喜欢重新发明轮子，而是用最好的手段解决问题。

Yuriy Zaytsev 2014.08.18 14:26 #100

Integer:
我认为这是另一个原因。因为在那里以不同的方式解决了向操作系统加载大数据的问题，它们不是被加载，而是直接从磁盘上读取。(我猜)

服务器会做...非常有效。

需要帮助!无法解决这个问题，我遇到了硬件限制 - 页 10