माइक्रोसॉफ्ट का प्रोजेक्ट अलेक्जेंड्रिया असुरक्षित शिक्षा का उपयोग करके दस्तावेजों का विश्लेषण करता है

माइक्रोसॉफ्ट का प्रोजेक्ट अलेक्जेंड्रिया असुरक्षित शिक्षा का उपयोग करके दस्तावेजों का विश्लेषण करता है

Posted on

एआई अपनाने की अवस्था में आपका उद्यम कहां खड़ा है? पता लगाने के लिए हमारे एआई सर्वेक्षण में भाग लें।


2014 में, माइक्रोसॉफ्ट ने प्रोजेक्ट अलेक्जेंड्रिया लॉन्च किया, जो अपने कैम्ब्रिज रिसर्च डिवीजन के भीतर एक शोध प्रयास है जो खोज संस्थाओं – सूचना के विषयों – और उनके संबंधित गुणों के लिए समर्पित है। संभाव्य प्रोग्रामिंग का उपयोग करते हुए ज्ञान खनन अनुसंधान में अनुसंधान प्रयोगशाला के काम पर निर्माण, अलेक्जेंड्रिया का उद्देश्य दस्तावेजों के एक सेट से स्वचालित रूप से पूर्ण ज्ञान आधार का निर्माण करना था।

अलेक्जेंड्रिया प्रौद्योगिकी हाल ही में घोषित Microsoft चिरायु विषयों को शक्ति प्रदान करती है, जो स्वचालित रूप से एक संगठन में बड़ी मात्रा में सामग्री और विशेषज्ञता का आयोजन करती है। विशेष रूप से, अलेक्जेंड्रिया टीम विषयों और मेटाडेटा की पहचान करने के लिए जिम्मेदार है, डेटासेट में दस्तावेज़ों की सामग्री को पार्स करने के लिए एआई को नियोजित करती है।

यह समझने के लिए कि अलेक्जेंड्रिया कितनी दूर आ गया है – और अभी भी जाना है – वेंचरबीट ने उत्पाद विकास के निदेशक नाओमी मनीपेनी, अलेक्जेंड्रिया प्रोजेक्ट लीड जॉन विन्न, और अलेक्जेंड्रिया इंजीनियरिंग मैनेजर योर्डन ज़ायकोव के साथ ईमेल के माध्यम से आयोजित एक साक्षात्कार में बात की। उन्होंने अलेक्जेंड्रिया के लक्ष्यों के साथ-साथ आज तक की प्रमुख सफलताओं पर अंतर्दृष्टि साझा की, और उन चुनौतियों पर विकास दल का सामना किया जो भविष्य के नवाचारों से दूर हो सकती हैं।

पार्सिंग ज्ञान

किसी उद्यम में जानकारी प्राप्त करना कठिन हो सकता है, और कई अध्ययनों से पता चलता है कि यह अक्षमता उत्पादकता को प्रभावित कर सकती है। एक सर्वेक्षण के अनुसार, कर्मचारियों को संभावित रूप से सप्ताह में चार से छह घंटे बचा सकते हैं यदि उन्हें जानकारी की तलाश नहीं करनी पड़ती। और फॉरेस्टर का अनुमान है कि नए कर्मचारियों को ऑनबोर्ड करने जैसे सामान्य व्यावसायिक परिदृश्य 20% से 35% तेज हो सकते हैं।

अलेक्जेंड्रिया इसे दो तरह से संबोधित करता है: विषय खनन और विषय लिंकिंग। विषय खनन में दस्तावेज़ों में विषयों की खोज और दस्तावेज़ों में परिवर्तन के रूप में उन विषयों का रखरखाव और रखरखाव शामिल है। टॉपिक लिंकिंग कई स्रोतों से ज्ञान को एक एकीकृत ज्ञान आधार में एक साथ लाता है।

“जब मैंने यह काम शुरू किया, तो मशीन लर्निंग को मुख्य रूप से संख्याओं की सरणियों – छवियों, ऑडियो पर लागू किया गया था। मुझे मशीन लर्निंग को अधिक संरचित चीजों में लागू करने में दिलचस्पी थी: संग्रह, तार, और प्रकार और गुणों वाली वस्तुएं, ” विन्न ने कहा। “इस तरह की मशीन लर्निंग नॉलेज माइनिंग के लिए बहुत उपयुक्त है, क्योंकि ज्ञान में ही एक समृद्ध और जटिल संरचना होती है। दुनिया को सटीक रूप से प्रस्तुत करने और हमारे उपयोगकर्ताओं की अपेक्षाओं को पूरा करने के लिए इस संरचना को पकड़ना बहुत महत्वपूर्ण है। ”

अलेक्जेंड्रिया के पीछे का विचार हमेशा ज्ञान को स्वचालित रूप से ज्ञान के आधार में निकालने का रहा है, शुरुआत में विकिपीडिया जैसी वेबसाइटों से खनन ज्ञान पर ध्यान देने के साथ। लेकिन कुछ साल पहले, दस्तावेज़, संदेश और ईमेल जैसे डेटा के साथ काम करते हुए, परियोजना उद्यम में परिवर्तित हो गई।

“उद्यम में संक्रमण बहुत रोमांचक रहा है। सार्वजनिक ज्ञान के साथ, ज्ञान के आधार को बनाने और बनाए रखने के लिए मैन्युअल संपादकों का उपयोग करने की संभावना हमेशा बनी रहती है। लेकिन एक संगठन के अंदर, ज्ञान को खोजने योग्य और काम करने के लिए उपयोगी बनाने के लिए स्वचालित रूप से ज्ञान आधार बनाने के लिए बहुत बड़ा मूल्य है, ” विन्न ने कहा। “बेशक, अंतराल को भरने और किसी भी त्रुटि को ठीक करने के लिए ज्ञान आधार को अभी भी मैन्युअल रूप से क्यूरेट किया जा सकता है। वास्तव में, हमने अलेक्जेंड्रिया मशीन लर्निंग को इस तरह के फीडबैक से सीखने के लिए डिज़ाइन किया है, ताकि निकाले गए ज्ञान की गुणवत्ता में समय के साथ सुधार हो सके। ”

ज्ञान खनन

अलेक्जेंड्रिया संभाव्य प्रोग्रामिंग नामक एक मशीन लर्निंग दृष्टिकोण के माध्यम से विषय खनन और लिंकिंग प्राप्त करता है, जो उस प्रक्रिया का वर्णन करता है जिसके द्वारा दस्तावेजों में विषयों और उनके गुणों का उल्लेख किया जाता है। दस्तावेज़ों से विषय निकालने के लिए उसी प्रोग्राम को पीछे की ओर चलाया जा सकता है। इस दृष्टिकोण का एक लाभ यह है कि कार्य के बारे में जानकारी लेबल किए गए डेटा के बजाय संभाव्य कार्यक्रम में ही शामिल है। यह प्रक्रिया को बिना पर्यवेक्षित चलाने में सक्षम बनाता है, जिसका अर्थ है कि यह बिना किसी मानवीय इनपुट के इन कार्यों को स्वचालित रूप से कर सकता है।

“इस परियोजना की स्थापना के बाद से परियोजना में बहुत प्रगति हुई है। मशीन सीखने की क्षमताओं के संदर्भ में, हमने बड़ी संख्या में संस्थाओं और संपत्तियों को निकालने और उनका प्रतिनिधित्व करने की अनुमति देने के लिए कई सांख्यिकीय प्रकार बनाए, जैसे कि एक परियोजना का नाम, या एक घटना की तारीख, “ज़ायकोव ने कहा। “हमने आत्मविश्वास से यह निर्धारित करने के लिए एक कठोर संयोजन एल्गोरिदम भी विकसित किया है कि विभिन्न स्रोतों से प्राप्त जानकारी एक ही इकाई को संदर्भित करती है या नहीं। जहां तक ​​इंजीनियरिंग की प्रगति का सवाल है, हमें सिस्टम का विस्तार करना था – एल्गोरिदम को समानांतर बनाना और उन्हें मशीनों में वितरित करना, ताकि वे वास्तव में बड़े डेटा पर काम कर सकें, जैसे कि किसी संगठन के सभी दस्तावेज़ या यहां तक ​​कि संपूर्ण वेब।”

संसाधित करने की आवश्यकता वाली जानकारी को कम करने के लिए, अलेक्जेंड्रिया पहले एक क्वेरी इंजन चलाता है जो ज्ञान युक्त होने की उच्च संभावना वाले प्रत्येक दस्तावेज़ से स्निपेट निकालने के लिए एक अरब से अधिक दस्तावेज़ों को स्केल कर सकता है। उदाहरण के लिए, यदि मॉडल प्रोजेक्ट अल्फा नामक कंपनी की पहल से संबंधित किसी दस्तावेज़ को पार्स कर रहा था, तो इंजन उन चरणों को निकालेगा जिनमें इकाई जानकारी होने की संभावना है, जैसे “प्रोजेक्ट अल्फा 9/12/2021 को जारी किया जाएगा” या “प्रोजेक्ट अल्फा चलाया जाता है” जेन स्मिथ द्वारा।”

माइक्रोसॉफ्ट प्रोजेक्ट अलेक्जेंड्रिया

पार्सिंग प्रक्रिया के लिए यह पहचानने की आवश्यकता होती है कि टेक्स्ट स्निपेट के कौन से हिस्से विशिष्ट संपत्ति मूल्यों से मेल खाते हैं। इस दृष्टिकोण में, मॉडल पैटर्न के एक सेट की तलाश करता है – टेम्प्लेट – जैसे “प्रोजेक्ट {नाम} को {दिनांक} को जारी किया जाएगा।” किसी टेम्प्लेट को टेक्स्ट से मिलाने से, प्रक्रिया यह पहचान सकती है कि टेक्स्ट के कौन से हिस्से कुछ गुणों से मेल खाते हैं। अलेक्जेंड्रिया संरचित और असंरचित दोनों पाठों से टेम्पलेट बनाने के लिए अप्रशिक्षित शिक्षण करता है, और मॉडल आसानी से हजारों टेम्पलेट्स के साथ काम कर सकता है।

अगला चरण लिंकिंग है, जो डुप्लिकेट या ओवरलैपिंग संस्थाओं की पहचान करता है और क्लस्टरिंग प्रक्रिया का उपयोग करके उनका विलय करता है। विन्न के अनुसार, आमतौर पर, अलेक्जेंड्रिया निकाली गई इकाई के विस्तृत विवरण के साथ प्रविष्टियां बनाने के लिए सैकड़ों या हजारों वस्तुओं का विलय करता है।

अलेक्जेंड्रिया का संभाव्य कार्यक्रम मनुष्यों द्वारा शुरू की गई त्रुटियों को हल करने में भी मदद कर सकता है, जैसे दस्तावेज़ जिसमें एक परियोजना के मालिक को गलत तरीके से दर्ज किया गया था। और लिंकिंग प्रक्रिया अन्य स्रोतों से आने वाले ज्ञान का विश्लेषण कर सकती है, भले ही वह ज्ञान किसी दस्तावेज़ से प्राप्त न किया गया हो। जानकारी जहां से भी आती है, उसे एक एकीकृत ज्ञान आधार प्रदान करने के लिए एक साथ जोड़ा जाता है।

वास्तविक दुनिया के अनुप्रयोग

जैसे ही अलेक्जेंड्रिया ने उद्यम की ओर रुख किया, टीम ने ऐसे अनुभवों की खोज शुरू की जो संगठनात्मक ज्ञान के साथ काम करने वाले कर्मचारियों का समर्थन कर सकें। इन अनुभवों में से एक विवा टॉपिक्स में विकसित हुआ, जो माइक्रोसॉफ्ट के सहयोग मंच, विवा का एक मॉड्यूल है जो संचार, ज्ञान और निरंतर सीखने को एक साथ लाता है।

Viva Topics SharePoint, Microsoft Search, और Office और जल्द ही Yammer, Teams, और Outlook जैसे ऐप्स के माध्यम से वितरित किए गए विषयों में जानकारी व्यवस्थित करने के लिए अलेक्जेंड्रिया पर टैप करता है। निकाले गए प्रोजेक्ट, ईवेंट, और लोगों के बारे में संबंधित मेटाडेटा वाले संगठन, सामग्री, परिवर्णी शब्द, परिभाषाएं और वार्तालाप प्रासंगिक रूप से जागरूक कार्ड में प्रस्तुत किए जाते हैं।

“चिरायु विषयों के साथ, [companies] भारी भारोत्तोलन करने के लिए हमारी एआई तकनीक का उपयोग करने में सक्षम हैं। यह मुक्त करता है [them] योगदान पर काम करने के लिए [their] खुद के दृष्टिकोण और दूसरों के काम के आधार पर नए ज्ञान और विचारों को पैदा करना,” मनीपेनी ने कहा। “चिरायु विषय ग्राहक समान चुनौतियों वाले सभी आकारों के संगठन हैं: उदाहरण के लिए, जब नए लोगों को शामिल करना, किसी कंपनी के भीतर भूमिकाएं बदलना, व्यक्ति के ज्ञान को बढ़ाना, या जो सीखा गया है उसे एक टीम से दूसरी टीम में तेजी से प्रसारित करने में सक्षम होना, और नवाचार करना उस साझा ज्ञान के शीर्ष पर। ”

माइक्रोसॉफ्ट प्रोजेक्ट अलेक्जेंड्रिया

विन्न और ज़ायकोव के अनुसार, अलेक्जेंड्रिया के लिए तकनीकी चुनौतियां आगे हैं, लेकिन अवसर भी हैं। निकट अवधि में, टीम प्रत्येक संगठन की आवश्यकताओं के अनुरूप एक स्कीमा बनाने की उम्मीद करती है। यह कर्मचारियों को किसी दिए गए स्थान (“डाउनटाउन कार्यालय भवन”) में एक निश्चित समय (“अगले दो सप्ताह”) में होने वाले किसी दिए गए प्रकार (उदाहरण के लिए “मशीन लर्निंग टॉक”) की सभी घटनाओं को खोजने देगा।

इसके अलावा, अलेक्जेंड्रिया टीम का लक्ष्य एक ज्ञान आधार विकसित करना है जो इस बात की समझ का लाभ उठाता है कि उपयोगकर्ता क्या हासिल करने की कोशिश कर रहा है और इसे हासिल करने में मदद करने के लिए स्वचालित रूप से प्रासंगिक जानकारी प्रदान करता है। विन्न इसे “निष्क्रिय से ज्ञान के सक्रिय उपयोग पर स्विच करना” कहते हैं, क्योंकि यह विचार किसी संगठन में ज्ञान को निष्क्रिय रूप से रिकॉर्ड करने से सक्रिय रूप से किए जा रहे कार्य का समर्थन करने के लिए स्विच करना है।

“हम पिछले उदाहरणों से सीख सकते हैं कि विशेष लक्ष्यों को प्राप्त करने के लिए कौन से कदम आवश्यक हैं और इन चरणों में सहायता और ट्रैक करने में सहायता करते हैं,” विन्न ने समझाया। “यह विशेष रूप से तब उपयोगी हो सकता है जब कोई व्यक्ति पहली बार किसी कार्य को कर रहा हो, क्योंकि यह उन्हें संगठन के ज्ञान को प्राप्त करने की अनुमति देता है कि कैसे कार्य करना है, किन कार्यों की आवश्यकता है, और अतीत में क्या काम किया है और क्या नहीं किया है। ।”

वेंचरबीट

वेंचरबीट का मिशन तकनीकी निर्णय लेने वालों के लिए परिवर्तनकारी तकनीक और लेन-देन के बारे में ज्ञान हासिल करने के लिए एक डिजिटल टाउन स्क्वायर बनना है।

जब आप अपने संगठनों का नेतृत्व करते हैं तो हमारा मार्गदर्शन करने के लिए हमारी साइट डेटा तकनीकों और रणनीतियों पर आवश्यक जानकारी प्रदान करती है। हम आपको हमारे समुदाय का सदस्य बनने के लिए आमंत्रित करते हैं:

  • आपकी रुचि के विषयों पर अप-टू-डेट जानकारी
  • हमारे समाचार पत्र
  • गेटेड विचार-नेता सामग्री और हमारे बेशकीमती आयोजनों के लिए रियायती पहुंच, जैसे कि रूपांतरण 2021: और अधिक जानें
  • नेटवर्किंग सुविधाएँ, और बहुत कुछ

सदस्य बने

Leave a Reply

Your email address will not be published. Required fields are marked *