डीबीटी लैब्स ने वेयरहाउस में डेटा बदलने में विश्लेषकों की मदद करने के लिए $150 मिलियन जुटाए

डीबीटी लैब्स ने वेयरहाउस में डेटा बदलने में विश्लेषकों की मदद करने के लिए $150 मिलियन जुटाए

Posted on

एआई अपनाने की अवस्था में आपका उद्यम कहां खड़ा है? पता लगाने के लिए हमारे एआई सर्वेक्षण में भाग लें।


होने दें ओएसएस एंटरप्राइज न्यूजलेटर अपनी ओपन सोर्स यात्रा का मार्गदर्शन करें! पंजी यहॉ करे.

डीबीटी (डेटा बिल्ड टूल) नामक एक ओपन सोर्स “एनालिटिक्स इंजीनियरिंग” टूल के पीछे कंपनी फिशटाउन एनालिटिक्स ने आज घोषणा की कि उसने डीबीटी लैब्स के रूप में फिर से ब्रांडेड किया है और $ 1.5 बिलियन वैल्यूएशन पर फंडिंग के सी राउंड में $ 150 मिलियन जुटाए हैं।

विश्लेषिकी इंजीनियरिंग, गैर-आरंभिक के लिए, एक अपेक्षाकृत नई भूमिका है जो डेटा वेयरहाउस में प्रवेश करने और विश्लेषण के लिए तैयार करने के बाद कच्चे डेटा को लेने की प्रक्रिया का वर्णन करती है। भूमिका स्वयं डेटा इंजीनियरिंग और डेटा एनालिटिक्स क्षेत्रों के बीच एक प्रकार के सेतु के रूप में कार्य करती है, जिससे उन्हें डेटा को एक उपयोगी रूप में बदलने की आवश्यकता होती है जिसे कंपनी में दूसरों (जैसे विपणक) द्वारा आसानी से पूछताछ की जा सकती है। डीबीटी लैब्स इस विवरण में एक डेटा विश्लेषक की भूमिका के साथ तुलना करता है:

एनालिटिक्स इंजीनियर अंतिम उपयोगकर्ताओं को स्वच्छ डेटा सेट प्रदान करते हैं, डेटा को इस तरह से मॉडलिंग करते हैं जिससे अंतिम उपयोगकर्ता अपने स्वयं के प्रश्नों का उत्तर दे सकें। जहां एक डेटा विश्लेषक डेटा का विश्लेषण करने में अपना समय व्यतीत करता है, वहीं एक एनालिटिक्स इंजीनियर अपना समय डेटा को बदलने, परीक्षण करने, परिनियोजित करने और दस्तावेज़ीकरण करने में व्यतीत करता है।

2016 में फिलाडेल्फिया से स्थापित, डीबीटी लैब्स ने पिछले पांच वर्षों में डेटा विश्लेषकों को “संगठन ज्ञान बनाने और प्रसारित करने” में मदद करने के लिए एक टूलसेट डिजाइन करने में बिताया है, जैसा कि यह कहता है। इसका मुख्य रूप से ओपन सोर्स डीबीटी प्रोजेक्ट के शीर्ष पर परामर्श सेवाएं प्रदान करना है, जिसका उपयोग हबस्पॉट, गिटलैब और जेटब्लू सहित प्रमुख कंपनियों द्वारा किया जाता है।

लेकिन डीबीटी क्या है, बिल्कुल? संक्षेप में, डीबीटी एक कमांड-लाइन टूल है जो डेटा विश्लेषकों को अपने सामान्य टेक्स्ट एडिटर में डीबीटी कोड लिखकर और फिर उनकी कमांड लाइन से डीबीटी को लागू करके कच्चे डेटा को बदलने में सक्षम बनाता है। Dbt फिर कोड को SQL में संकलित करता है और इसे कंपनी के डेटाबेस के विरुद्ध निष्पादित करता है। इस प्रकार, डीबीटी एक विकास वातावरण है जो “डेटा विश्लेषकों की पसंदीदा भाषा बोलता है” (यदि आप सोच रहे थे तो एसक्यूएल है)।

ऊपर: उपयोगकर्ता डीबीटी के साथ बातचीत कर रहा है

संदर्भ के लिए, एक आधुनिक एंटरप्राइज़ डेटा स्टैक में असंख्य घटक होते हैं, जिसमें फ़ाइवट्रान जैसे डेटा अंतर्ग्रहण उपकरण और स्नोफ्लेक और Google के BigQuery जैसे क्लाउड-आधारित डेटा वेयरहाउस शामिल हैं। डेटा को “एक्सट्रैक्ट, ट्रांसफॉर्म, लोड” (ETL) नामक प्रक्रिया के हिस्से के रूप में डेटा वेयरहाउस में प्रवेश पर “रूपांतरित” किया जा सकता है, जहां मैटिलियन जैसी कंपनियां खेल में आती हैं। लेकिन डेटा को बाद में सीधे गोदाम में SQL स्क्रिप्ट चलाकर एक प्रक्रिया के माध्यम से परिवर्तित किया जा सकता है जिसे “एक्सट्रैक्ट, लोड, ट्रांसफॉर्म” (ईएलटी) के रूप में जाना जाता है। उत्तरार्द्ध तेजी से लोडिंग समय प्राप्त करता है, लेकिन अधिक प्रसंस्करण शक्ति की आवश्यकता होती है क्योंकि डेटा को मांग पर बदलने की आवश्यकता होती है – यही वह जगह है जहां स्नोफ्लेक और बिगक्वेरी जैसे आधुनिक एनालिटिक्स डेटाबेस की शक्ति वास्तव में चमकती है।

सीधे शब्दों में कहें, ईएलटी में डीबीटी “टी” है – यह डेटा को बदलने के लिए बनाया गया है जो पहले से ही डेटा वेयरहाउस में रहता है। डीबीटी लैब्स के सीईओ और कोफाउंडर ट्रिस्टन हैंडी ने वेंचरबीट को बताया, “आधुनिक डेटा स्टैक में डीबीटी एक महत्वपूर्ण टुकड़ा है – यह क्लाउड डेटा प्लेटफॉर्म से जुड़ता है और डेटा सेट को बदलने, परीक्षण करने और तैनात करने के लिए इन प्लेटफॉर्म की सभी कंप्यूटिंग शक्ति का लाभ उठाता है।”

परिवर्तन के बाद, कंपनियां इन डेटासेट का उपयोग अपनी इच्छानुसार किसी भी चीज़ के लिए कर सकती हैं, चाहे वह मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए हो या व्यापार खुफिया (बीआई) टूल जैसे झांकी या लुकर में फीड करने के लिए हो।

कहानी अब तक

हैंडी के अनुसार, उन्होंने शुरू में एक डेटा विश्लेषक के रूप में अपने स्वयं के अनुभवों के आधार पर डीबीटी विकसित किया।

“मैंने डेढ़ दशक तक डेटा विश्लेषक के रूप में काम किया और हमेशा भयानक वर्कफ़्लोज़ द्वारा धीमा कर दिया गया – स्प्रेडशीट को आगे और पीछे ईमेल करना, बड़े पैमाने पर सीएसवी फाइलें डाउनलोड करना, मेरे डेस्कटॉप पर एसक्यूएल फाइलों को सहेजना,” उन्होंने कहा।

फास्ट फॉरवर्ड पांच साल, और हैंडी ने कहा कि लॉन्च के बाद से प्रत्येक वर्ष dbt अपनाने में 200% की वृद्धि हुई है, और Q1 2021 में उनकी कंपनी का उद्यम राजस्व साल-दर-साल दोगुना हो गया। इसके पीछे मुख्य प्रेरक शक्ति, जैसा कि इन दिनों लगभग हर नई तकनीक के मामले में प्रतीत होता है, ऑन-प्रिमाइसेस इन्फ्रास्ट्रक्चर से क्लाउड कंप्यूटिंग में तेजी से संक्रमण है – इस मामले में, क्लाउड-आधारित डेटा प्लेटफ़ॉर्म जैसे डेटाब्रिक्स, बिगक्वेरी, स्नोफ्लेक , और अमेज़ॅन रेडशिफ्ट।

“हमारे उद्योग के लिए बड़ा बदलाव क्लाउड में संक्रमण है,” हैंडी ने कहा। “आधुनिक क्लाउड डेटा प्लेटफ़ॉर्म ‘चीज़’ का एक मौलिक रूप से नया वर्ग है जो एक दशक पहले की ऑन-प्रिमाइसेस दुनिया में संभव नहीं था। डेटा बहुत तेज़ी से बढ़ता है, और उस डेटा के शीर्ष पर कार्यभार को संसाधित करना अत्यधिक परिवर्तनशील होता है। इन दोनों कारकों का मतलब है कि क्लाउड की लोच बेहद महत्वपूर्ण है, और यह हमारा विश्वास है कि आने वाले दशक में सभी – या सभी डेटा वर्कलोड क्लाउड में माइग्रेट हो जाएंगे।”

क्लाउड द्वारा वहन की जाने वाली मापनीयता और लोच उन चीजों के लिए दरवाजे खोलती है जो पहले एक विकल्प नहीं थे, जैसे कि गोदाम में डेटा परिवर्तन करने की क्षमता जो चीजों को बहुत गति देती है।

“क्लाउड के मौलिक अनलॉक का मतलब है कि प्रदर्शन एक मुद्दे से बहुत कम हो गया है, जिसने डेटा विश्लेषकों को संपूर्ण अंतर्दृष्टि-उत्पादन प्रक्रिया को संभालने में सक्षम बनाया है,” हैंडी ने जारी रखा। “इसके बदले में, एनालिटिक्स इंजीनियरिंग का उदय हुआ है – वह अभ्यास जिसके द्वारा विश्लेषक क्लाउड डेटा प्लेटफॉर्म के शीर्ष पर आधुनिक पाइपलाइनों का निर्माण करते हैं।”

मुझे धन दिखाइए

अब से पहले, डीबीटी लैब्स ने लगभग 42 मिलियन डॉलर जुटाए थे, जिनमें से संपूर्ण पिछले 14 महीनों में दो अलग-अलग दौर की फंडिंग में आया था। अपने नवीनतम नकद इंजेक्शन के साथ – जो सिकोइया कैपिटल, आंद्रेसेन होरोविट्ज़ और अल्टीमीटर के सह-नेतृत्व में था – कंपनी ने कहा कि वह अपने मुख्य ओपन सोर्स प्लेटफॉर्म के विकास को दोगुना कर देगी।

हैंडी ने कहा, “अभी हमारा ध्यान अपनी मुख्य पेशकश में सुधार लाने और सभी उद्यम सॉफ्टवेयर में उच्चतम विकास वाले क्षेत्रों में से एक की नींव के रूप में इसकी घातीय वृद्धि का समर्थन करने पर है।” “उत्पाद विकास के कुछ प्रयोगात्मक नए क्षेत्रों पर भी हमारी नजर है, लेकिन हम अभी तक कुछ भी साझा करने के लिए तैयार नहीं हैं।”

रीब्रांड के लिए, ठीक है, यह भी काफी मायने रखता है कि पिछले पांच वर्षों में फिशटाउन एनालिटिक्स और डीबीटी कैसे विकसित हुए हैं। प्रारंभ में, डीबीटी विशुद्ध रूप से एक खुला स्रोत उत्पाद था जिसमें कोई व्यावसायिक घटक नहीं था – फिशटाउन एनालिटिक्स परियोजना का प्राथमिक योगदानकर्ता और उपयोगकर्ता था, और इसने ओपन सोर्स प्रोजेक्ट के शीर्ष पर परामर्श सेवाएं बेचीं। हालांकि, बीच के वर्षों में, डीबीटी ने अपनी प्रीमियम टीम और एंटरप्राइज योजनाएं हासिल कीं, जिसमें एपीआई एक्सेस, सिंगल साइन-ऑन, पेशेवर सेवाएं और बहुत कुछ शामिल हैं। इस कारण से, एक ही उत्पाद का मुद्रीकरण करने वाले दो अलग-अलग “ब्रांडों” की आवश्यकता नहीं है, कुछ ऐसा जो भ्रम पैदा कर सकता है।

“यह भ्रम फिशटाउन एनालिटिक्स से हमारा नाम बदलने के लिए एक बड़ा प्रेरक था,” हैंडी ने कहा। “कंपनी का नाम बदलने में, हम डीबीटी के साथ अपने संबंधों का एक बयान दे रहे हैं – जिसे हमने बनाया और बनाए रखा – और इसकी दीर्घकालिक सफलता के लिए प्रतिबद्धता।”

डीबीटी इंटरफ़ेस

ऊपर: डीबीटी इंटरफ़ेस

ओएसएस कारक

डीटीबी लैब्स के अनुसार, डीबीटी समुदाय स्लैक में लगभग 15,000 “डेटा पेशेवर”, डीबीटी का उपयोग करने वाली 5,500 कंपनियां, और 1,000 डीबीटी क्लाउड ग्राहक हैं जो वेब-आधारित इंटरफ़ेस के माध्यम से केंद्रीकृत पहुंच के लिए भुगतान करते हैं।

हालाँकि, यह देखते हुए कि dbt एक अनुमेय Apache 2.0 लाइसेंस के तहत जारी किया गया है, इसका मतलब है कि व्यापक वाणिज्यिक दुनिया इसे कैसे अपनाती है, इस पर बहुत कम प्रतिबंध हैं। तो क्या इसका मतलब यह नहीं हो सकता कि अन्य गहरी जेब वाली कंपनियां डीबीटी के शीर्ष पर निर्माण कर सकती हैं? यह बहुत अधिक हो सकता है, यही वजह है कि डीबीटी लैब्स ने पिछले दो राउंड के बाद इतनी जल्दी फंडिंग का एक और बड़ा हिस्सा जुटाने के लिए चुना है।

हैंडी ने कहा, “डीबीटी कई प्रमुख क्लाउड डेटा प्लेटफार्मों में भारी मात्रा में उपयोग करता है – जो इन प्लेटफार्मों के लिए डीबीटी और उसके समुदाय को बहुत रणनीतिक बनाता है।” “हम यह भी जानते हैं कि प्रमुख क्लाउड प्रदाता ओपन सोर्स सॉफ़्टवेयर के प्रबंधित संस्करणों को बेचना पसंद करते हैं। उन दो चीजों को एक साथ रखें और हमारी अपेक्षा यह है कि आने वाले वर्ष में कम से कम एक, यदि अधिक नहीं, तो क्लाउड प्लेटफॉर्म किसी प्रकार की प्रबंधित डीबीटी सेवा शुरू करेगा। हमारा स्थान गर्म हो रहा है, और यह हमें अलग-अलग उत्पादों के निर्माण की क्षमता में तेजी लाने के लिए मजबूर करता है। इसलिए हमने फिर से उठाया।”

वेंचरबीट

तकनीकी निर्णय लेने वालों के लिए परिवर्तनकारी तकनीक और लेनदेन के बारे में ज्ञान हासिल करने के लिए वेंचरबीट का मिशन एक डिजिटल टाउन स्क्वायर बनना है।

जब आप अपने संगठनों का नेतृत्व करते हैं तो हमारा मार्गदर्शन करने के लिए हमारी साइट डेटा तकनीकों और रणनीतियों पर आवश्यक जानकारी प्रदान करती है। हम आपको हमारे समुदाय का सदस्य बनने के लिए आमंत्रित करते हैं:

  • आपकी रुचि के विषयों पर अप-टू-डेट जानकारी
  • हमारे समाचार पत्र
  • गेटेड विचार-नेता सामग्री और हमारे बेशकीमती आयोजनों के लिए रियायती पहुंच, जैसे रूपांतरण 2021: और अधिक जानें
  • नेटवर्किंग सुविधाएँ, और बहुत कुछ

सदस्य बने

Leave a Reply

Your email address will not be published. Required fields are marked *