8 технологий, которые меняют базу данных

Начнем с основного вопроса — что такое база данных? Как только ей было дано определение. Тогда этого было достаточно, чтобы иметь человека, который помещает данные в таблицу со множеством прямых строк и вертикальных столбцов. Длинные, бесконечные прямоугольники информации, смотрящие в будущее.
Реляционная база данных стала основой современных расчетов. Большинство сайтов — это фасад CSS, за которым стоит SQL. Большая часть материала, который заставляет нас чувствовать себя особенным, — это еще одна строка в большой таблице жизни.
Любовь к большой матрице медленно умирает, и разработчики понимают, что не все может быть помещено в таблицу. И поскольку они умны и стремятся найти решения всех проблем, они ищут лучшие места для хранения информации.
За последние несколько лет появилось много решений по защите и хранению данных.
Однако они поднимают ряд вопросов — можем ли мы назвать «базу данных» новыми и хорошими возможностями? Должны ли данные по-прежнему застревать в большой матрице, чтобы стать базой данных? Некоторые аналитики используют термин «хранилище данных», чтобы отличать современные методы, поскольку «база данных» слишком тесно связана со старой табличной структурой.
8 способов размещения базы данных в новые формы и стандарты.
Графические вычисления
В то время видеокарты были предназначены для работы графических приложений, но в настоящее время графические процессоры выполняют много неграфической обработки.
Поиск данных — это только одна из неграфических операций, которые часто используются. А почему нет?
Перенос бесконечных стеков данных в поисках соответствия — это параллельная операция, состоящая из множества простых задач, которые повторяются миллионы раз. В задачу легко включить тысячи графических процессоров.
Выгода заключается не в том, чтобы выполнять каждый индивидуальный запрос (который не занимает много времени) на подготовительную работу, потому что он почти ненужен для предварительной обработки.
Многие базы данных экономят время, сохраняя список, который на самом деле является предсказанным результатом любого возможного поиска. Если этот список поврежден или уничтожен, для восстановления может потребоваться несколько часов, дней или даже месяцев.
Если данные находятся в памяти графического процессора, вы обычно можете обойтись без индекса. В случае быстрого изменения данных большая часть списка останется непригодной. Тогда пропуская система будет очень эффективной.
Энергонезависимая память (NVRAM)
50 лет назад задача разработчика была намного легче. Им не нужно было передавать данные между ОЗУ и диском машины с использованием сложных протоколов для обеспечения согласованности. Тогда память была «железным» ядром, и не было никакой опасности потерять какую-либо информацию, если она прекратила питание. Хорошие старые времена могут скоро вернуться, потому что производители микросхем говорят о замене ОЗУ NVRAM или энергонезависимой памятью.
Это серьезное изменение в игре программистов для хранения данных, поскольку одной из основных проблем является опасность потери информации. Как и ожидалось, база данных будет быстрее, потому что обработка транзакций будет упрощена.
Другие тяготеют к идее встраивания журнала восстановления после того, как данные записаны на носителе, но не раньше.
Пока никто не может сказать, что выйдет из этого дыма. Будут ли люди использовать больше баз данных, если им не нужна постоянная запись? Будет ли поиск и индексирование заставлять их возвращаться в базу данных? Все алгоритмы, вероятно, будут переосмыслены. Какой будет лучший способ использования NVRAM — это будет ясно после десятилетия.
Расширение SQL
Когда начался модус несвязанных баз данных NoSQL, одним из значительных преимуществ была возможность хранения информации в разных узлах.
Cassandra и MongoDB заставили нас подумать, что если мы получим функции большого масштабируемого хранилища, мы должны выйти из удобного SQL-мира.
На самом деле такой компромисс не нужен. Если в самых ранних экспериментах большие масштабируемые БД были упрощены без использования всех хранилищ SQL, нет причин, по которым SQL не будет хорошо работать на нескольких машинах, где запущен огромный массив информации. Такие компании, как Oracle, делают это в течение многих лет.
Новые гипермасштабируемые базы данных позволяют использовать ваши знания и опыт работы с SQL, а также удобство работы с набором данных, распределенных в большом кластере. Например, в CockroachDB запросы передаются через стандартную машину SQL, которая обращается к много узловым скопированным данным с проверкой ACID. Конечно, вы заплатите определенную цену за техническое обслуживание, что гарантирует плотность данных, но не на должном уровне.
Если DD важны для вашей работы, ищите такие продукты, как CockroachDB, Google Cloud Spanner, Clustrix, Azure SQL и NuoDB.
Геопространственные базы данных
Традиционно базы данных предоставляются для одномерных массивов, а не для двумерных координат географии. Но вы также можете «обмануть» стандартную БД и выполнить ее непростые задачи с географическими координатами.
Попробуйте поместить параметры ширины и длины в отдельные столбцы: вы можете искать строки, содержащие ячейки, определяемые по ширине и длине. Но если вы хотите выйти за рамки этих основных данных, стандартные SQL-запросы не сработают.
Геопространственные базы данных имеют несколько дополнительных функций, которые значительно упрощают поиск, сортировку и расширенный поиск в 2D-пространстве. Пространственные индексы, например, обычно работают, добавляя сетку над координатной зоной для более быстрого поиска по строкам, смежным с двумерными и трехмерными данными.
Эти индексы позволяют запрашивать запросы, такие как «содержание», «перекрытия» и даже «сенсорные» кратные, определенные полигонами. Все это делает описание реального мира намного более эффективным.
Столбцы
Таблицы — хороший способ хранения данных, но они не работают, если целью является создание новой большой базы, такой как те, которые используются в Интернете.
Поскольку так называемый «социальный график» взрывается, мы загружаем наш компьютер с большим количеством узлов и связей между ними. И ссылки часто важнее данных в них. Сохранение и связывание пары узлов легко с классической реляционной базой данных, но более сложные запросы невозможны.
Столбцы упрощают реализацию таких запросов. Нет необходимости в бесконечном извлечении данных из таблиц, потому что ссылки определяют, где будет падать запрос. Такие инструменты, как Neo4J, OrientDB и DataStax, теперь являются одними из обязательных опций. У них также есть собственные языки запросов.
ПО
Одним из самых больших изменений является то, как мы покупаем программное обеспечение базы данных. В прошлом мы купили наши собственные машины и подписали лицензионные соглашения для используемого программного обеспечения. Теперь облачные компании предлагают хранить информацию, которую мы не видим и не трогаем. Они просто говорят нам, что данные будут там, когда мы их ищем.
Преимущества очевидны. Нет необходимости поддерживать сервер или необходимые помещения. Вы даже можете забыть о лицензировании, настройке и установке обновлений. Кто-то еще имеет дело со всем этим. Решение часто дешевле — особенно если у вас нет большого количества данных. Услуги обычно оплачиваются в соответствии с занятым пространством.
Но опасности, если таковые имеются, лежат в тени. Кто-нибудь еще имеет доступ к данным? Защищен ли сервер от удара током, грозы или наводнения? Являются ли данные надежными? Для этого вам нужно доверять поставщику.
Искусственный интеллект
Говорят, что искусственный интеллект — это всего лишь термин для исследований последнего поколения продуктов. Существует ряд новых продуктов и решений, украшенных словами «машинное обучение» или «нейронные сети» или «глубокое обучение». Они могут не выглядеть как база данных, а просто заполнять их данными и задавать им вопросы. Почему нет?
Хорошая новость в искусственном интеллекте заключается в том, что вам не нужно знать, что вы ищете. Просто размахивая рукой и желая что-то нездоровое или «самое интересное» или «самое близкое». Вам не нужно иметь правильный ключ, ссылочный номер, который люди при обслуживании клиентов всегда просят сохранить.
Плохая новость заключается в том, что вы не будете знать, получили ли вы правильный ответ, потому что не задали точный вопрос. Самое интересное это сообщение? С другой стороны, самый большой секрет успеха Google заключается в том, что нет абсолютно правильного ответа. Список инструментов машинного обучения слишком длинный, чтобы его можно было открыть. Вы всегда можете спросить свою любимую поисковую систему для «самого интересного».
Блокчейн
Блокировка часто связана со сложной экономикой и политикой биткоин, но если мы не будем обсуждать тему cryptoLooks, это чрезвычайно стабильный, практичный и хорошо упорядоченное хранилище данных. У каждого из «длинного стола» есть возможность обновить данные и поделиться им. Удивительно, что все разделяют одни и те же ответы. Это идеально подходит для бизнеса, потому что конкуренты дружелюбны.
Ряд разработчиков идут дальше и говорят о «умных контрактах», что является еще одним способом сказать, что биты в базе данных достаточно надежны для использования в правовой сфере. Это недостижимо с простой базой данных, которая может быть изменена любым человеком с правами администратора.
Однако есть слабые места. Каждый пользователь должен поддерживать ключ шифрования, поскольку все транзакции должны быть подписаны в цифровом виде. Если этот ключ потерян или забыт, данные в этих рядах будут заморожены навсегда. Если этот ключ украден, все ставки исключены. Блокчейн не идеален, другими словами, он намного надежнее стандартной модели.
Ripple и IBM — всего лишь два из многих конкурентов, исследующих пространство. Многие из ведущих банков имеют свои собственные внутренние проекты. И компании, такие как криптовалюта bitcoin и Altcoin, также являются значительной частью экосистемы.

загрузка...

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *