Анализът на данни и управлението на данни станаха изключително важни, тъй като цифровата трансформация прави бизнеса все по-конкурентоспособен. Но с бързото нарастване на обема данни, които трябва да се анализират, организациите се нуждаят от начин да съберат всички тези данни на едно място, узрели за анализ. Влезте в съвременни облачни складове за данни като Snowflake и AWS Redshift. И двете са добре уважавани платформи за съхранение на данни.
И двете осигуряват обема, скоростта и качеството, изисквани от приложенията за бизнес разузнаване и анализ на данни. Но въпреки че има много прилики между тези платформи за съхранение на данни, всяка от тях има различна ориентация. Следователно изборът често се свежда до предпочитания на платформата и пригодност за стратегията за данни на организацията.
Вижте също: Най-добрите инструменти за анализ на данни
Снежинка срещу червено изместване: Сравняване на ключови характеристики
Снежинката е а релационна база данни система за управление и хранилище за аналитични данни за структурирани и полуструктурирани данни. Предлага се чрез Софтуер като услуга (SaaS), той използва SQL машина за база данни, за да управлява как информацията се съхранява в базата данни. Той обработва заявки към виртуални складове в рамките на цялостния склад, всеки в собствен възел на клъстер, независим от другите и не споделя изчислителни ресурси.
На върха на това са облачните услуги за удостоверяване, управление на инфраструктура, заявки, контрол на достъпа и т.н. Snowflake Elastic Data Warehouse позволява на потребителите да анализират и съхраняват данни, използвайки ресурси на Amazon S3 или Azure.
AWS Redshift се позиционира като петабайтова скала склад за данни услуга, която може да се използва от BI инструменти за анализ. Потребителите могат лесно да увеличават и намаляват мащаба. Подобно на Snowflake, Amazon предлага независими клъстери на потребителите. Тези клъстери се използват и за балансиране на натоварването за подобряване на производителността. Той предлага добра производителност на заявки благодарение на връзките с висока честотна лента, непосредствена близост до потребителите поради многобройните центрове за данни на Amazon по целия свят и персонализирани комуникационни протоколи. Поради многото услуги, които съществуват в Amazon, потребителите имат лесен достъп до надеждни архиви за своите набори от данни Redshift.
Сравнявайки двете хранилища за данни по функции, Snowflake има по-стабилна поддръжка за JSON-базирани функции, както и по-добра автоматизация за поддръжка на база данни. Redshift, от друга страна, изисква повече практическа работа по поддръжката. И двете осигуряват колонно съхранение и масивна паралелна обработка (MPP) за едновременни аналитични изчисления и бързо запитване дори при огромни набори от данни. Snowflake поддържа отделни изчисления, съхранение и облачни услуги, въпреки че предлага едновременно мащабиране. Redshift догонва подобни функции и сега не изостава.
Като цяло, Snowflake печели с широки характеристики.
Snowflake срещу Redshift: Сравнение за поддръжка и лекота на използване
Твърди се, че складът за данни на Snowflake е удобен за потребителя с интуитивен SQL интерфейс, който го прави лесен за настройка и работа. Amazon Redshift също се казва, че е лесен за използване и изисква много малко администрация за ежедневна употреба.
Ако потребителят вече съхранява данни в Amazon S3, тогава настройката, интеграцията и изпълнението на заявките са лесни. Redshift също така поддържа множество формати за извеждане на данни, включително JSON. Тези с опит в SQL ще открият, че е лесно да впрегнат PostgreSQL за работа с данни.
И двете платформи за съхранение на данни предлагат онлайн поддръжка, но Snowflake също осигурява 24/7 поддръжка на живо. Redshift е малко по-сложен и обвързва повече ИТ управление при поддръжка поради липса на автоматизация в сравнение със Snowflake, който автоматизира вакуумирането на данни, компресирането, диагностиката и други функции.
Няма нужда да копирате данни по време на операции за увеличаване на мащаба със Snowflake. Amazon изисква известно копиране и други водопроводни инсталации. Подобно на споделянето на данни от трети страни и достъпа до тях за извършване на анализ, Snowflake прави целия процес много по-лесен. Snowflake поддържа структурирани и полуструктурирани, докато Redshift няма поддръжка за полуструктурирани типове данни.
Снежинка печели в тази категория.
Снежинка срещу Червено изместване: Сравняване на сигурността
Redshift отбелязва някои ключови точки за сигурност и съответствие. Тези функции се прилагат изчерпателно за всички потребители. Освен това са налични инструменти за управление на достъпа, криптиране на клъстери, групи за сигурност за клъстери, криптиране на данни по време на пренос и покой, SSL сигурност на връзката и защита на идентификационните данни за влизане. Правата за достъп са подробни и могат да бъдат много локализирани.
По този начин Redshift улеснява ограничаването на входящия или изходящия достъп до клъстери. Мрежата може също да бъде изолирана в рамките на a виртуален частен облак (VPC) и свързан с ИТ инфраструктурата чрез VPN.
Snowflake също така може да се похвали с винаги включено криптиране, заедно с мрежова изолация и други стабилни функции за сигурност. Но за разлика от Amazon, неговите защитни функции се предлагат на нива и всяко по-високо ниво струва повече. И все пак от положителна страна, в крайна сметка не плащате за функции за сигурност, от които не се нуждаете или желаете.
AWS Redshift печели по отношение на сигурността.
Снежинка срещу Червено изместване: Сравняване на интеграцията
Очевидно тези, които вече са се ангажирали с платформите на AWS, ще намерят безпроблемна интеграция на Redshift с услуги като Athena, DMS, DynamoDB и CloudWatch.
Snowflake е на AWS Marketplace, но не е толкова вграден в екосистемата на AWS и му липсва дълбочината и широчината на партньорството с доставчици, които Amazon може да събере. В някои случаи може да бъде предизвикателство да интегрирате Snowflake с други инструменти. Но в други случаи Snowflake е силно интегрирана. Tableau, Apache Spark, IBM Cognos и Qlik са напълно интегрирани. Тези, които използват тези инструменти, ще намерят анализ за лесен за изпълнение.
Интеграция: Redshift печели.
Снежинка срещу Червено изместване: Сравнение на цените
Ценообразуването при поискване е характеристика и на двата продукта. Но тези две платформи за съхранение на данни използват различен подход към опаковането.
Snowflake поддържа отделни изчисления и съхранение в своята ценова структура. Redshift ги комбинира. Snowflake осигурява автоматично мащабиране на паралелност с всички издания без допълнителни разходи. Redshift осигурява специално количество ежедневно мащабиране на паралелност. Но вие получавате таксуване на секундата, ако е надвишена.
Дългосрочните договори на Redshift идват с големи отстъпки. Клиентите могат да бъдат таксувани с почасова ставка (по тип и възли на клъстер) или по количество сканиране на байтове. Ценообразуването на Snowflake е по-сложно с пет различни издания – от основното нагоре – и цените се повишават, докато се придвижвате нагоре по нивата.
По този начин разликите между тях затрудняват извършването на пълно сравнение между ябълки и ябълки. Потребителите се съветват да оценят ресурсите, които очакват да им бъдат необходими, за да поддържат обема на прогнозните си данни, обема на обработка и техните изисквания за анализ. За някои потребители Amazon ще бъде по-евтин, за други Snowflake ще излезе напред.
Грубо казано, Redshift струва около 25 цента на час, а Snowflake около $40 на месец. Но скоростта на използване ще варира значително в зависимост от натоварването. Някои потребители казват, че Redshift е по-евтин за ценообразуване при поискване и че големите набори от данни струват повече на Snowflake поради цената му за изчисление и съхранение поотделно.
Тази категория е близка, тъй като варира от случай на употреба. Но Amazon Redshift получава одобрението.
Снежинка срещу червено изместване: Заключение
Snowflake и Redshift са отлични хранилища за данни за целите на анализа на данни. Всеки има своите плюсове и минуси. Сравнението се свежда до модели на използване, обеми от данни, работни натоварвания и стратегии за данни.
Amazon не е подходящ за приложения за обработка на транзакции. Ако моделът на данните означава, че постоянно ще се извършва сканиране на байтове, ценообразуването може да излезе извън контрол. Но ценообразуването може също да ескалира на Snowflake, когато се включат по-високи нива. Ако имате нужда от най-високо ниво на функционалност и сигурност на най-високото ниво, Amazon може да измисли по-добър вариант.
Някои казват, че снежинката е по-добра, когато започвате с малко и постепенно увеличавате. Твърди се, че Redshift е най-добрият за големи реализации от корпоративен клас. Но това са общи положения и не винаги ще се получи. Всеки бизнес трябва да проучи как разходите ще работят за него.
За някои, пакетирането на изчисления и съхранение на Redshift ще го направи много по-евтино. Но обратното може да важи за други натоварвания. В тези случаи способността на Snowflake да разделя цените за изчисления и съхранение може да е най-добра.
Друга точка на диференциация е JSON съхранението. И двете го поддържат, но Snowflake предлага повече опции. Тези с много JSON трафик и заявки са по-добре на Snowflake.
И тогава има влиянието на Amazon. Да, Snowflake работи на Amazon, но тежките потребители на AWS биха били най-добри в Redshift поради по-добра интеграция с цялата екосистема на Amazon. И накрая, Snowflake функционира добре с базите данни на приложения на живо, а Redshift не. В крайна сметка потребителят трябва да определи, като провери техните работни натоварвания за пригодност, след което претегли коя от тези две фини платформи за данни ще отговаря най-добре на техните модели на данни.