प्रेस्टो एसक्यूएल, अब ट्रिनो, बिग डेटा एनालिटिक्स क्वेरी इंजन की शक्ति लाता है

click fraud protection

बिग डेटा प्रोसेसिंग इस डिजिटल युग के महत्वपूर्ण पहलुओं में से एक है। कंपनियां अधिक कृत्रिम बुद्धिमत्ता, मशीन लर्निंग और डेटा एनालिटिक्स का उपयोग करती हैं, जो अधिक डेटा का उत्पादन और संग्रह करती हैं। इसलिए, इसका परिणाम भारी मात्रा में डेटा जिसे कुशलतापूर्वक पूछताछ और विश्लेषण करने की आवश्यकता है।

यहां क्लाउड कंप्यूटिंग और प्रेस्टो मदद कर सकते हैं।

विषयसूचीप्रदर्शन
प्रेस्टो क्या है?
प्रमुख धारणाएँ
सर्वर प्रकार
प्रेस्टो प्रश्नों को कैसे संसाधित करता है?
प्रेस्टो का उपयोग करने के लाभ
1. आसान एकीकरण
2. तेज़ प्रदर्शन
3. बादल के लिए बनाया गया
4. एकीकृत SQL इंटरफ़ेस
आप प्रेस्टो का उपयोग किस लिए कर सकते हैं?
डेटा लेक एनालिटिक्स
तदर्थ पूछताछ
बैच ईटीएल

प्रेस्टो क्या है?

Amazon AWS परिभाषा के अनुसार: Presto एक वितरित SQL क्वेरी इंजन है, जिसे किसी भी आकार के डेटासेट पर तेज़ विश्लेषणात्मक क्वेरी करने के लिए बनाया गया है। प्रोजेक्ट को प्रेस्टोडब से अलग करने के लिए इसे 2020 के अंत में ट्रिनो के रूप में पुनः ब्रांडेड किया गया था।

प्रेस्टो को ओपन-सोर्स होने का फायदा है, जिसका अर्थ है कि इसे नियमित रूप से अपडेट किया जाता है और डेवलपर्स इसमें अक्सर योगदान करते हैं।

प्रेस्टो प्लेटफॉर्म किसके साथ काम करता है गैर-संबंधपरक डेटा स्रोत पसंद:

  • अमेज़न S3
  • हडूप
  • एचडीएफएस
  • मोंगोडीबी
  • HBase

और संबंधपरक डेटाबेस पसंद:

  • मेरी जगह
  • PostgresSQL और
  • एमएस एसक्यूएल सर्वर

साथ हाथ की सफ़ाई, आप डेटा को कहीं भी संग्रहीत कर सकते हैं। इसका मतलब है कि आपको डेटा को रिलेशनल डेटाबेस या डेटा वेयरहाउस में स्थानांतरित करने की आवश्यकता नहीं है। Presto को SQL के लिए बनाया गया था और यह मानक SQL सेमेन्टिक्स का समर्थन करता है। इसमें उप-प्रश्न, जटिल प्रश्न, बाहरी जुड़ाव, अलग-अलग गणना और अनुमानित प्रतिशत शामिल हैं।

क्वेरी निष्पादित करना भी तेज़ है, क्योंकि यह मेमोरी-आधारित आर्किटेक्चर के समानांतर चलता है। इसलिए, आपको अब इस बारे में चिंता करने की ज़रूरत नहीं है कि एक विशाल डेटाबेस को क्वेरी करने में कितना समय लग सकता है। परिणाम सेकंड में वापस आ जाते हैं।

सीखना प्रेस्टो को कैसे तैनात करें और उनके प्रलेखन पर इसकी वास्तुकला।

यह भी पढ़ें: विंडोज 10 पर डिवाइस ड्राइवर्स को कैसे अपडेट करें? {सरल गाइड}


प्रमुख धारणाएँ

प्रमुख SQL अवधारणाएँ व्यापक रूप से जानी जाती हैं। यह समझने के लिए कि प्रेस्टो कैसे काम करता है, हमें पहले इसकी मूल अवधारणाओं को समझना होगा।

सर्वर प्रकार

प्रेस्टो दो सर्वर प्रकारों का उपयोग करता है: the समन्वयक सर्वर और काम करने वाला सर्वर। कार्यकर्ता नोड्स कनेक्टर्स से डेटा प्राप्त करते हुए प्रश्नों को संसाधित करते हैं। समन्वयक परिणाम प्राप्त करता है और उन्हें ग्राहक को भेजता है। समन्वयक सर्वर भी बयानों को पार्स करते हैं और नोड्स का प्रबंधन करते हैं।

यह मैसिव पैरेलल प्रोसेसिंग डेटाबेस मैनेजमेंट सिस्टम के समान काम करता है।

बड़े पैमाने पर समानांतर प्रसंस्करण डेटाबेस प्रबंधन प्रणालीछवि स्रोत: ट्यूटोरियल पॉइंट

प्रेस्टो वितरित सिस्टम और स्रोत के बीच लिंक करने के लिए कनेक्टर्स का उपयोग करता है, उदाहरण के लिए, Amazon S3। प्रेस्टो के कई कनेक्टर, संबंधपरक और गैर-संबंधपरक स्रोतों से, सिस्टम को लगभग किसी भी डेटा स्रोत के लिए एक्स्टेंसिबल बनाते हैं।

यह भी पढ़ें: विंडोज 10,8,7 पर ड्राइवर्स को कैसे अपडेट करें - डिवाइस ड्राइवर्स को अपडेट करें


प्रेस्टो प्रश्नों को कैसे संसाधित करता है?

जब प्रेस्टो को कोई प्रश्न प्राप्त होता है, तो वह इसे कई चरणों में तोड़कर निष्पादित करता है। आमतौर पर सिस्टम एक रूट स्टेज और संबंधित स्टेज बनाता है। फिर चरणों को कार्यकर्ता नोड्स में कार्यों में वितरित किया जाता है।


प्रेस्टो का उपयोग करने के लाभ

नेटफ्लिक्स, फेसबुक, एटलसियन और एयरबीएनबी जैसे बड़े उद्यमों के साथ प्रेस्टो बहुत लोकप्रिय हो रहा है। उदाहरण के लिए, फेसबुक हर दिन एक पेटाबाइट डेटा को संसाधित करने के लिए प्रेस्टो का उपयोग करता है, जो 30k से अधिक प्रश्नों को चलाता है।

प्रेस्टो में दो अलग-अलग ओपन-सोर्स प्रोजेक्ट शामिल हैं: प्रेस्टोएसक्यूएल (जिसे अब ट्रिनो कहा जाता है) और प्रेस्टोडीबी। यह विभिन्न प्रकार के डेटा लेक और डेटा वेयरहाउस में उपयोग के मामलों की एक विस्तृत श्रृंखला के लिए बहुत लोकप्रिय है। आइए कुछ ऐसे फायदों पर नजर डालते हैं जो प्रेस्टो को इतना लोकप्रिय बनाते हैं।

1. आसान एकीकरण

प्रेस्टो के प्रमुख लाभों में से एक यह है कि यह बिना किसी संशोधन के आपके मौजूदा डेटा सिस्टम के साथ एकीकृत होता है। इसलिए, प्रेस्टो को जोड़कर आप अपने मौजूदा सिस्टम को बदलने की आवश्यकता के बिना तेजी से विश्लेषण क्षमताएं जोड़ते हैं।

2. तेज़ प्रदर्शन

प्रेस्टो के विकसित होने का एक कारण यह था कि मौजूदा अपाचे हाइव ने इंटरैक्टिव प्रश्नों के साथ अच्छा प्रदर्शन नहीं किया था। प्रेस्टो को इंटरैक्टिव बीआई प्रश्नों को संभालने के लिए डिज़ाइन किया गया है। इसके अलावा, यह पुश मॉडल का अनुसरण करता है, एक साथ कई चरणों का उपयोग करके SQL क्वेरी को संसाधित करता है, जिसका अर्थ है कि सभी चरणों को चरणों के बीच प्रतीक्षा किए बिना पाइपलाइन किया जाता है।

प्रेस्टो में मेमोरी-टू-मेमोरी डेटा ट्रांसफर भी है, डिस्क पर डेटा लिखने की आवश्यकता के बिना, प्रदर्शन को बढ़ाता है।

3. बादल के लिए बनाया गया

प्रेस्टो स्टोरेज चलाता है और अलग से गणना करता है, जो इसे क्लाउड वातावरण के लिए बहुत उपयुक्त बनाता है। PrestoSQL का उपयोग करने वाली कंपनियां डेटा हानि के बिना लोड के आधार पर आसानी से ऊपर या नीचे स्केल कर सकती हैं। ऐसा इसलिए हो सकता है क्योंकि प्रेस्टो क्लस्टर कोई डेटा स्टोर नहीं करता है।

4. एकीकृत SQL इंटरफ़ेस

SQL डेटा एनालिटिक्स के लिए सबसे लोकप्रिय भाषा है। डेटा वैज्ञानिक, विश्लेषक और इंजीनियर डेटा के प्रसंस्करण, विश्लेषण और परीक्षण के लिए SQL का उपयोग करते हैं, इसे व्यावसायिक खुफिया उपकरणों के साथ एकीकृत करते हैं।

प्रेस्टो में न केवल SQL स्रोतों से डेटा को क्वेरी करने की क्षमता है, बल्कि Elasticsearch और Cassandra जैसे NoSQL डेटाबेस से भी। यह एएनएसआई-एसक्यूएल और पोस्टग्रेज कनेक्टिविटी को सपोर्ट करता है। यह प्रेस्टो को एक बहुमुखी प्रतिभा देता है जो अन्य वितरित प्रणालियों में नहीं है।

इंटरफ़ेस मध्यम आकार के डेटा के लिए आदर्श है क्योंकि इसमें समान है खिड़की के कार्य कि PostgreSQL है।

यह भी पढ़ें: विंडोज 10 में ग्राफिक्स ड्राइवर्स को कैसे अपडेट करें {सरल गाइड}


आप प्रेस्टो का उपयोग किस लिए कर सकते हैं?

विभिन्न प्रकार के उपयोग के मामलों के लिए उद्योगों में प्रेस्टो का उपयोग किया जाता है। यह विशेष रूप से तदर्थ और संवादात्मक प्रश्नों के लिए उपयुक्त है। आइए कुछ सामान्य उपयोग के मामलों का पता लगाएं:

डेटा लेक एनालिटिक्स

आप डेटा को बदलने की आवश्यकता के बिना डेटा लेक पर डेटा क्वेरी करने के लिए PrestoSQL का उपयोग कर सकते हैं। प्रेस्टो आपको डेटा को क्वेरी करने की अनुमति देता है जहां वह बैठता है। इसलिए, आप संरचित और असंरचित डेटा को क्वेरी करके अपने डेटा लेक एनालिटिक्स को सशक्त बनाने के लिए इसका उपयोग कर सकते हैं।

तदर्थ पूछताछ

प्रेस्टो आपको किसी भी समय क्वेरी चलाने की अनुमति देता है, भले ही आपका डेटा कहीं भी हो। इससे भी बेहतर, प्रेस्टो कनेक्टर्स के साथ, आपकी टीम डेटा स्रोतों की एक विस्तृत श्रृंखला में डेटासेट तक पहुंच सकती है, और चूंकि क्वेरी घंटों के बजाय सेकंड में चलाई जाती हैं, इसलिए आपका सिस्टम तेजी से प्रदर्शन करता है।

बैच ईटीएल

लीगेसी बैच प्रोसेसिंग सिस्टम का उपयोग करने के बजाय, आप प्रेस्टो का उपयोग उन प्रश्नों को चलाने के लिए कर सकते हैं जो संसाधनों पर कुशल हैं। आप कई डेटा स्रोतों से डेटा एकत्र कर सकते हैं और उच्च-थ्रूपुट क्वेरी कर सकते हैं।

संक्षेप में, प्रेस्टो के पास उन कंपनियों के लिए कई फायदे हैं जिन्हें बड़ी मात्रा में डेटा संसाधित करने, तदर्थ, संवादात्मक प्रश्नों का संचालन करने और अलग-अलग डेटा स्रोतों से विश्लेषण चलाने की आवश्यकता होती है।