How Chipotle leveraged curated data for a COVID risk assessment model

Posted on

एआई/एमएल ऑटोमेशन टेक्नोलॉजी समिट के लिए ट्रांसफॉर्म 2021 में एआई और डेटा लीडर्स से जुड़ें। अब देखिए!


ट्रांसफॉर्म 2021 के दौरान, स्नोफ्लेक में एआई/एमएल स्ट्रैटेजी के प्रमुख अहमद खान डेटा के महत्व के बारे में बात करने के लिए चिपोटल मैक्सिकन ग्रिल के प्रमुख डेटा वैज्ञानिक मैश सैयद के साथ बैठे, और कैसे उच्च-गुणवत्ता वाले डेटा सेट प्रदर्शन और सटीकता में सुधार कर सकते हैं मशीन लर्निंग मॉडल और व्यावसायिक मूल्य प्रदान करने की उनकी क्षमता। चिपोटल के लिए, व्यापार मूल्य कंपनी की महामारी के दौरान जोखिम मूल्यांकन मॉडल बनाने की क्षमता थी।

लॉकडाउन की शुरुआत में, कंपनी ने ग्राहक कर्मचारी सुरक्षा और ग्राहक सुरक्षा प्रोटोकॉल, आपूर्तिकर्ता बाधाओं, आपूर्तिकर्ताओं को कैसे प्रभावित किया जा रहा था, और यहां तक ​​​​कि कर्मचारियों के लिए यात्रा सुरक्षित थी या नहीं, इसके बारे में निर्णय लेने के लिए एक आंतरिक COVID टास्क फोर्स को एक साथ रखा।

टीम ने सैयद को अपने आंतरिक डेटा के साथ-साथ COVID केस नंबरों के लिए सार्वजनिक रूप से उपलब्ध डेटा का उपयोग करने के लिए एक परियोजना का नेतृत्व करने के लिए टैप किया, ताकि उन्हें यह समझने में मदद मिल सके कि कैसे मामले बढ़ रहे थे और बढ़ रहे थे, और काउंटी स्तर पर जोखिम का स्तर क्या था। इस डेटा को उस काउंटी में रेस्तरां के लिए जोखिम स्तर की साजिश करने के लिए एक विज़ुअलाइज़ेशन टूल में बदल दिया गया था। टीम ने जोखिम स्तरों का आकलन करने के लिए रंग कोड सौंपे हैं – हरा, पीला और लाल। इन बुनियादी वर्गीकरणों के साथ, उन्होंने अमेरिका का एक भौगोलिक मानचित्र बनाया जहां वे देश भर में होने वाली एक ढाल देख सकते थे।

उन्होंने यह वर्गीकृत करने के लिए XGBoost वर्गीकरण मॉडल का उपयोग किया कि क्या अमेरिका में दी गई काउंटी केस गिनती के मामले में अपनी वर्गीकरण रैंकिंग में ऊपर जा रही है। पायथन और कोड सीधे थे। चुनौती तीसरे पक्ष के स्रोत की थी जिस पर उन्होंने विश्वसनीय डेटा के लिए भरोसा किया और डेटा को अपना काम करने के लिए बुनियादी ढांचे के निर्माण की आवश्यकता थी – जो कि उनके एज़्योर डेटा स्टोरेज फ़ोल्डर्स में दिखाना था, ताकि वे उस डेटा को डेटाब्रिक्स में खींच सकें। .

सैयद ने कहा, “काउंटी स्तर के डेटा का लाभ उठाने से हमें वह अंतर्दृष्टि मिली, लेकिन हम उस डेटा स्रोत के प्रति आभारी थे।” “उन दिनों जब यह उपलब्ध था, उसने अपना काम किया और यह एक खूबसूरत चीज थी, लेकिन निश्चित रूप से ऐसे कई उदाहरण थे जहां यह उपलब्ध नहीं था जब हमें इसकी आवश्यकता थी।”

काउंटी स्तर पर, उन्हें एक दिन केस काउंट मिलेंगे, और फिर कुछ भी नहीं, और बहुत सारे उदाहरणों में, डेटा कुछ समय बाद दोपहर तक अपडेट नहीं होगा।

“समय सार का था,” उन्होंने कहा। “हमें जल्द से जल्द निर्णय लेने की आवश्यकता है ताकि हम सुरक्षित रहें और हमारे कर्मचारी सुरक्षित रहें और हम उन उद्देश्यों को पूरा कर रहे हैं जिनके लिए हमारी टास्क फोर्स की स्थापना की गई थी।”

उन्हें और टीम के एक अन्य डेटा वैज्ञानिक को डेटा फ़ैक्टरी का लाभ उठाने के लिए एपीआई को पिंग करना था, फ़ाइल को पुनः प्राप्त करना था, यह देखने के लिए कि डेटा की अधिकतम तिथि पिछले दिन की तारीख से मेल खाती है, और यदि नहीं, तो 15 में लूप जारी रखें- लगातार डेटा देखने के लिए मिनट की वृद्धि। उस डेटा स्रोत के साथ दूसरी चुनौती यह थी कि सभी काउंटियों ने किसी दिए गए दिन में मामलों की संख्या की रिपोर्ट नहीं की होगी।

लापता और अविश्वसनीय तृतीय-पक्ष डेटा का समाधान स्नोफ्लेक बाज़ार था, सैयद ने कहा, जो 140 से अधिक तृतीय-पक्ष डेटा प्रदाताओं और डेटा-सेवा प्रदाताओं से 500 से अधिक लाइव और रेडी-टू-क्वेरी डेटा सेट तक पहुंच प्रदान करता है।

“यह आपके लिए क्यूरेट किया गया है, इसे बनाए रखा जा रहा है, यह एक अच्छे प्रारूप में है, इसलिए मैं पहले जो लेगवर्क कर रहा था, वह तस्वीर से बाहर कर दिया गया था,” उन्होंने कहा।

इससे पहले कि वह तीसरे पक्ष के डेटा स्रोत को स्विच करने के लिए छलांग लगाता, सयाद ने स्नोफ्लेक डेटा पर एक गहरा गोता लगाया ताकि यह सुनिश्चित किया जा सके कि डेटा में वे गुण थे जिनकी उन्हें आवश्यकता थी – जो केस काउंट, डेथ और काउंटी आइडेंटिफ़ायर या FIPS कोड थे विशेष रूप से। एक बार जब उसने इसे लागू कर दिया, तो वह उन नोटबुक्स में जाने में सक्षम हो गया, जहां वह अपने द्वारा बनाई गई पाइपलाइन को चलाने के लिए सभी कोड बनाए रख रहा था, जिसमें तीसरे पक्ष के डेटा के साथ काम करने के लिए कई अलग-अलग घटक शामिल थे, और प्रमुख भागों को हटा दें इसे सरल बनाने के लिए। डेटा कंपनी में हितधारकों के लिए भी उपलब्ध है।

वे भविष्य में जनसांख्यिकी और विपणन से संबंधित समृद्ध डेटा सेट के लिए बाज़ार का लाभ उठाने की योजना बना रहे हैं, जैसे कि अमेरिकी जनगणना क्यूरेटेड डेटा सेट, मार्केटिंग, एलटीवी और आरएफएम में उपयोग के मामलों के लिए, और वे प्रोजेक्ट जो वे ग्राहकों को समझने में कर रहे हैं, व्यक्तिगत यात्राओं का निर्माण, और बहुत कुछ।

“तकनीकी रूप से महत्वपूर्ण बात यह है कि न केवल आपके पास क्यूरेटेड, विश्वसनीय डेटा सेट से आपके ग्राहक और आपके हितधारकों के लिए आसानी से उपलब्ध होने वाली जीत है, बल्कि आपने प्रक्रिया को सुव्यवस्थित भी किया है, इसलिए इसे बनाए रखने के लिए सिरदर्द से कम नहीं है आप एक डेटा वैज्ञानिक के रूप में, ”सयाद ने कहा। “यह वास्तव में संतोषजनक रहा है।”

वेंचरबीट

वेंचरबीट का मिशन तकनीकी निर्णय लेने वालों के लिए परिवर्तनकारी तकनीक और लेन-देन के बारे में ज्ञान हासिल करने के लिए एक डिजिटल टाउन स्क्वायर बनना है।

जब आप अपने संगठनों का नेतृत्व करते हैं तो हमारा मार्गदर्शन करने के लिए हमारी साइट डेटा तकनीकों और रणनीतियों पर आवश्यक जानकारी प्रदान करती है। हम आपको हमारे समुदाय का सदस्य बनने के लिए आमंत्रित करते हैं:

  • आपकी रुचि के विषयों पर अप-टू-डेट जानकारी
  • हमारे समाचार पत्र
  • गेटेड विचार-नेता सामग्री और हमारे बेशकीमती आयोजनों के लिए रियायती पहुंच, जैसे कि रूपांतरण 2021: और अधिक जानें
  • नेटवर्किंग सुविधाएँ, और बहुत कुछ

सदस्य बने

Leave a Reply

Your email address will not be published. Required fields are marked *