Presto SQL, şimdi Trino, Büyük Veri Analitiği Sorgu Motorlarının Gücünü Getiriyor

Büyük veri işleme, bu dijital çağın kritik yönlerinden biridir. Şirketler, daha fazla veri üreten ve toplayan daha fazla yapay zeka, makine öğrenimi ve veri analitiği kullanır. Bu nedenle, büyük miktarda veri verimli bir şekilde sorgulanması ve analiz edilmesi gerekir.

İşte burada bulut bilişim ve Presto yardımcı olabilir.

İçindekilergöstermek
Presto Nedir?
Anahtar kavramlar
Sunucu türleri
Presto sorguları nasıl işler?
Presto kullanmanın avantajları
1. Kolay entegrasyon
2. Daha hızlı performans
3. Bulut için tasarlandı
4. Birleşik SQL arayüzü
Presto'yu ne için kullanabilirsiniz?
Veri gölü analitiği
Geçici sorgulama
Toplu ETL

Presto Nedir?

Amazon AWS tanımına göre: Presto, her boyuttaki veri kümelerinde hızlı analitik sorgular gerçekleştirmek için oluşturulmuş, dağıtılmış bir SQL sorgu motorudur. Projeyi Prestodb'dan ayırmak için 2020'nin sonunda Trino olarak yeniden markalandı.

Presto, açık kaynak olma avantajına sahiptir, bu da düzenli olarak güncellendiği ve geliştiricilerin buna sıklıkla katkıda bulunduğu anlamına gelir.

Presto platformu aşağıdakilerle çalışır: ilişkisel olmayan veri kaynakları beğenmek:

  • Amazon S3
  • Hadoop
  • HDFS
  • MongoDB
  • HBase

Ve ilişkisel veritabanları beğenmek:

  • Benim alanım
  • PostgresSQL ve
  • MS SQL Sunucusu

İle presto, verileri depolandığı her yerde sorgulayabilirsiniz. Bu, verileri ilişkisel bir veritabanına veya veri ambarına aktarmanız gerekmediği anlamına gelir. Presto, SQL için oluşturulmuştur ve standart SQL semantiğini destekler. Buna alt sorgular, karmaşık sorgular, dış birleşimler, farklı sayılar ve yaklaşık yüzdelikler dahildir.

Bellek tabanlı bir mimariye paralel çalıştığı için sorguları yürütmek de daha hızlıdır. Bu nedenle, büyük bir veritabanını sorgulamanın ne kadar süreceği konusunda artık endişelenmenize gerek yok. Sonuçlar saniyeler içinde geri gelir.

Öğrenmek Presto nasıl dağıtılır ve mimarisi onların belgelerinde.

Ayrıca Okuyun: Windows 10'da Aygıt Sürücüleri Nasıl Güncellenir? {Basit Kılavuz}


Anahtar kavramlar

Anahtar SQL kavramları yaygın olarak bilinmektedir. Presto'nun nasıl çalıştığını anlamak için önce temel kavramlarını anlamamız gerekir.

Sunucu türleri

Presto iki sunucu türü kullanır: koordinatör sunucu ve çalışan sunucu. Çalışan düğümler, bağlayıcılardan veri alarak sorguları işler. Koordinatör sonuçları alır ve müşteriye gönderir. Koordinatör sunucuları ayrıca ifadeleri ayrıştırır ve düğümleri yönetir.

Massive Parallel Processing veritabanı yönetim sistemlerine benzer şekilde çalışır.

Büyük Paralel İşleme veritabanı yönetim sistemleriResim Kaynağı: tutorialspoint

Presto, dağıtılmış sistem ile kaynak, örneğin Amazon S3 arasında bağlantı kurmak için bağlayıcılar kullanır. Presto'nun ilişkisel ve ilişkisel olmayan kaynaklara yönelik sayısız bağlayıcısı, sistemi hemen hemen her veri kaynağına genişletilebilir hale getirir.

Ayrıca Okuyun: Windows 10,8,7'de Sürücüler Nasıl Güncellenir – Aygıt Sürücülerini Güncelleyin


Presto sorguları nasıl işler?

Presto bir sorgu aldığında, onu birden çok aşamaya bölerek yürütür. Tipik olarak sistem bir kök aşama ve ilgili aşamalar oluşturur. Aşamalar daha sonra çalışan düğümler arasında görevlere dağıtılır.


Presto kullanmanın avantajları

Presto, Netflix, Facebook, Atlassian ve Airbnb gibi büyük şirketler arasında çok popüler hale geliyor. Örneğin Facebook, her gün bir petabayt veriyi işlemek için Presto'yu kullanıyor ve 30 binden fazla sorgu çalıştırıyor.

Presto, iki ayrı açık kaynaklı proje içerir: PrestoSQL (artık Trino olarak adlandırılır) ve PrestoDB. Farklı veri gölleri ve veri ambarları türlerinde çok çeşitli kullanım durumları için çok popülerdir. Presto'yu bu kadar popüler yapan bazı avantajlara bakalım.

1. Kolay entegrasyon

Presto'nun en önemli avantajlarından biri, değişiklik gerektirmeden mevcut veri sisteminizle bütünleşmesidir. Bu nedenle, Presto'yu ekleyerek, mevcut sisteminizde ince ayar yapmanıza gerek kalmadan hızlı analitik yetenekleri eklersiniz.

2. Daha hızlı performans

Presto'nun geliştirilmesinin nedenlerinden biri, mevcut Apache Hive'ın etkileşimli sorgularla iyi performans göstermemesiydi. Presto, etkileşimli BI sorgularını işlemek için tasarlanmıştır. Ayrıca, bir SQL sorgusunu aynı anda birden fazla aşama kullanarak işleyerek Push modelini takip eder, yani tüm aşamalar aşamalar arasında beklemeden ardışık düzene geçer.

Presto ayrıca, performansı artıran, diske veri yazmaya gerek kalmadan bellekten belleğe veri aktarımına sahiptir.

3. Bulut için tasarlandı

Presto, depolamayı çalıştırır ve ayrı olarak hesaplar, bu da onu bulut ortamları için çok uygun hale getirir. PrestoSQL kullanan şirketler, veri kaybına neden olmadan yüke bağlı olarak kolayca ölçeklendirebilir veya küçültebilir. Bu, Presto kümesinin herhangi bir veri depolamaması nedeniyle olabilir.

4. Birleşik SQL arayüzü

SQL, veri analitiği için en popüler dildir. Veri bilimcileri, analistler ve mühendisler, verileri iş zekası araçlarıyla entegre ederek verileri işlemek, analiz etmek ve test etmek için SQL'i kullanır.

Presto, yalnızca SQL kaynaklarından değil, Elasticsearch ve Cassandra gibi NoSQL veritabanlarından da veri sorgulama yeteneğine sahiptir. ANSI-SQL ve Postgres bağlantısını destekler. Bu, Presto'ya diğer dağıtılmış sistemlerin sahip olmadığı bir çok yönlülük sağlar.

Arayüz orta büyüklükteki veriler için idealdir çünkü aynı Pencere fonksiyonları PostgreSQL'in sahip olduğu.

Ayrıca Okuyun: Windows 10'da Grafik Sürücüleri Nasıl Güncellenir {Basit Kılavuz}


Presto'yu ne için kullanabilirsiniz?

Presto, çok çeşitli kullanım durumları için endüstriler arasında kullanılmaktadır. Geçici ve etkileşimli sorgular için özellikle uygundur. Bazı yaygın kullanım örneklerini inceleyelim:

Veri gölü analitiği

Verileri dönüştürmeye gerek kalmadan bir veri gölündeki verileri sorgulamak için PrestoSQL'i kullanabilirsiniz. Presto, verileri bulunduğu yerde sorgulamanıza olanak tanır. Bu nedenle, yapılandırılmış ve yapılandırılmamış verileri sorgulayarak veri gölü analizlerinizi güçlendirmek için kullanabilirsiniz.

Geçici sorgulama

Presto, verilerinizin nerede bulunduğundan bağımsız olarak istediğiniz zaman sorgu çalıştırmanıza olanak tanır. Daha da iyisi, Presto bağlayıcılarla ekipleriniz çok çeşitli veri kaynaklarındaki veri kümelerine erişebilir ve sorgular saatler yerine saniyeler içinde çalıştırıldığından, sisteminiz daha hızlı çalışır.

Toplu ETL

Eski toplu işleme sistemlerini kullanmak yerine, kaynaklar üzerinde verimli sorguları çalıştırmak için Presto'yu kullanabilirsiniz. Birden çok veri kaynağından veri toplayabilir ve yüksek verimli sorgular gerçekleştirebilirsiniz.

Özetle, Presto'nun büyük miktarda veriyi işlemesi, geçici, etkileşimli sorgular yürütmesi ve farklı veri kaynaklarından analitik çalıştırması gereken şirketler için çeşitli avantajları vardır.