एकवचन मूल्य अपघटन (SVD) और प्रमुख घटक विश्लेषण (PCA) के बीच अंतर

एकवचन मूल्य अपघटन (एसवीडी) डेटा अधिग्रहण के लिए संख्यात्मक रैखिक बीजगणित में सबसे व्यापक रूप से उपयोग और सर्व-उद्देश्यीय सहायक सुविधाओं में से एक है, जबकि प्रमुख घटक विश्लेषण (पीसीए) एक अच्छी तरह से स्थापित विधि है जिसने आंकड़ों के बारे में बहुत सारे सिद्धांत पेश किए हैं। विशेष रूप से, पीसीए हमें डेटा-संचालित पदानुक्रमित समन्वय प्रणाली प्रदान करता है।

एकवचन मूल्य अपघटन (SVD) और प्रमुख घटक विश्लेषण (PCA) के बीच अंतर

एकवचन मूल्य अपघटन और प्रमुख घटक विश्लेषण के बीच मुख्य अंतर यह है कि एसवीडी एक डेटा-संचालित फूरियर ट्रांसफॉर्म सामान्यीकरण है, जबकि पीसीए हमें डेटा के आधार पर एक पदानुक्रमित समन्वय प्रणाली का उपयोग करके हमारे डेटा सेट में सांख्यिकीय विविधताओं का प्रतिनिधित्व करने की अनुमति देता है।

एकवचन मूल्य अपघटन (एसवीडी) संख्यात्मक रैखिक बीजगणित में सबसे व्यापक रूप से उपयोग की जाने वाली विशेषता है। यह विश्लेषण, समझ और विवरण के लिए आवश्यक प्रमुख विशेषताओं में डेटा को कम करने में सहायता करता है। एसवीडी विशेष रूप से डेटा में कमी के लिए अधिकांश डेटा प्रीप्रोसेसिंग और मशीन लर्निंग एल्गोरिदम में पहले तत्वों में से एक है। एसवीडी एक डेटा-संचालित फूरियर ट्रांसफॉर्म सामान्यीकरण है।

प्रमुख घटक विश्लेषण (पीसीए) अब एक सांख्यिकीय उपकरण है जिसने कई विचारों को जन्म दिया है। यह हमें सांख्यिकीय परिवर्तनों को व्यक्त करने के लिए बिंदुओं के श्रेणीबद्ध सेट का उपयोग करने की अनुमति देगा। पीसीए एक सांख्यिकीय/मशीन इंटेलिजेंस तकनीक है जिसका उपयोग प्रमुख डेटा पैटर्न को निर्धारित करने के लिए किया जाता है जो समग्र भिन्नता को अधिकतम करते हैं। तो डेटा की दिशाओं के आधार पर एक समन्वय प्रणाली द्वारा अधिकतम विचरण पर कब्जा कर लिया जाता है।

एकवचन मूल्य अपघटन (SVD) और प्रमुख घटक विश्लेषण (PCA) के बीच तुलना तालिका

तुलना के पैरामीटरएकवचन मूल्य अपघटन (एसवीडी)प्रधान घटक विश्लेषण (पीसीए)
आवश्यकताएंसार गणित, मैट्रिक्स अपघटन, और क्वांटम भौतिकी सभी को SVD की आवश्यकता होती है।पीसीए में अनुसंधान से डेटा का विश्लेषण करने के लिए सांख्यिकी विशेष रूप से प्रभावी है।
अभिव्यक्तिबीजीय व्यंजकों का गुणनखंडन करना।अनुमानित गुणनखंडित अभिव्यक्तियों के समान।
तरीकोंयह अमूर्त गणित और मैट्रिक्स अपघटन में एक विधि है।यह सांख्यिकी/मशीन लर्निंग में एक विधि है।
डालीगणित की शाखा में सहायक।गणित की शाखा में सहायक।
आविष्कारएसवीडी का आविष्कार यूजेनियो बेल्ट्रामी और केमिली जॉर्डन ने किया था।पीसीए का आविष्कार कार्ल पियर्सन ने किया था।

एकवचन मूल्य अपघटन (SVD) क्या है?

एसवीडी दृढ़ता से एक सकारात्मक निश्चित मैट्रिक्स के आइजेनवेल्यू और ईजेनवेक्टर फैक्टराइजेशन के हिस्से से जुड़ा हुआ है। हालांकि सभी आव्यूहों को पीटी के रूप में गुणनखंडित नहीं किया जा सकता है, किसी भी एम × एन मैट्रिक्स ए को बाईं ओर और पीटी को किसी भी दो ऑर्थोगोनल मैट्रिस यू और वीटी होने की अनुमति देकर कारक बनाया जा सकता है (जरूरी नहीं कि एक दूसरे को स्थानांतरित करें) इस प्रकार का विशेष गुणनखंड SVD के रूप में जाना जाता है।

साइन और कोसाइन विस्तार सभी गणित में अनुमानित कार्यों के लिए उपयोग किए जाते हैं, और एफटी सबसे उपयोगी परिवर्तनों में से एक है। बेसेल और हवादार फ़ंक्शन, साथ ही गोलाकार हार्मोनिक्स भी हैं। और, कंप्यूटर विज्ञान और इंजीनियरिंग की पिछली पीढ़ी में, इस गणितीय मॉडल गणितीय परिवर्तन का उपयोग ब्याज की एक प्रणाली को एक नई समन्वय प्रणाली में स्थानांतरित करने के लिए किया गया था।

प्रमुख एल्गोरिदम में से एक एसवीडी है। राजस्व उत्पन्न करने के लिए कोई रैखिक बीजगणित का उपयोग कर सकता है। लाभ कमाने के लिए रैखिक बीजगणित का उपयोग करने के सबसे उपयोगी पहलुओं में से एक यह है कि यह व्यापक है क्योंकि यह बहुत ही सरल और पठनीय रैखिक बीजगणित पर आधारित है जिसे किसी भी समय उपयोग किया जा सकता है। यदि आपके पास डेटा मैट्रिक्स है, तो आप svd की गणना कर सकते हैं और व्याख्यात्मक और समझदार विशेषताएं प्राप्त कर सकते हैं जिससे आप मॉडल बना सकते हैं। यह स्केलेबल भी है, इस प्रकार इसका उपयोग बहुत बड़े डेटा सेट पर किया जा सकता है।

प्रत्येक मैट्रिक्स फ़ैक्टर को तीन भागों में विभाजित किया जाता है, जिसे यू सिग्मा वी ट्रांसपोज़ के रूप में जाना जाता है। एक ओर्थोगोनल मैट्रिक्स एक घटक यू है। विकर्ण मैट्रिक्स कारक सिग्मा है। कारक v स्थानान्तरण वैसे ही एक ओर्थोगोनल मैट्रिक्स है, जो इसे ओर्थोगोनल विकर्ण या शारीरिक रूप से खींच और घुमाता है। प्रत्येक मैट्रिक्स को एक ऑर्थोगोनल मैट्रिक्स में एक विकर्ण मैट्रिक्स (एकवचन मान) द्वारा दूसरे ऑर्थोगोनल मैट्रिक्स से गुणा करके गुणा किया जाता है: रोटेशन, टाइम स्ट्रेच, टाइम्स रोटेशन।

प्रिंसिपल कंपोनेंट एनालिसिस (PCA) क्या है?

पीसीए एक अच्छी तरह से स्थापित विधि है जिसने आंकड़ों के बारे में बहुत सारे सिद्धांत पेश किए हैं। यह ‘सबसे बड़े’ शब्दों को बनाए रखते हुए और सभी छोटे’ शब्दों को समाप्त करके एक गुणनखंडित कथन का अनुमान लगाने के बराबर है। यह एक अच्छी तरह से स्थापित विधि है जिसने आंकड़ों के बारे में बहुत सारे सिद्धांत पेश किए हैं। विशेष रूप से, पीसीए हमें डेटा-संचालित पदानुक्रमित समन्वय प्रणाली प्रदान करता है।

प्रधान घटक विश्लेषण (पीसीए) को अक्सर उपयुक्त ऑर्थोगोनल अपघटन के रूप में जाना जाता है। पीसीए डेटा में पैटर्न को समानता और अंतर के संदर्भ में परिभाषित करके पहचानने की एक विधि है। पीसीए में, एक डेटा मैट्रिक्स एक्स होता है जिसमें विभिन्न प्रयोगों से मापों का संग्रह होता है, और दो स्वतंत्र प्रयोगों को x1, x2 पर बड़ी पंक्ति कारकों के रूप में दर्शाया जाता है, और इसी तरह।

पीसीए एक आयामी कमी दृष्टिकोण है जो मशीन सीखने के प्रशिक्षण में उपयोग किए जाने वाले डेटा सेट के आयामों को कम करने में सहायता कर सकता है। यह भयानक आयामीता अभिशाप को कम करता है। पीसीए एक प्रमुख घटक की सबसे महत्वपूर्ण विशेषताओं को निर्धारित करने की एक विधि है जिसका लक्ष्य चर पर सबसे अधिक प्रभाव पड़ता है। पीसीए एक नया फीचर सिद्धांत घटक विकसित करता है।

के बीच मुख्य अंतर एकवचन मूल्य अपघटन (SVD) और प्रमुख घटक विश्लेषण (पीसीए)

  1. एसवीडी सीधे तौर पर बीजगणितीय व्यंजकों को फैक्टरिंग करने के लिए तुलनीय है, जबकि पीसीए ‘सबसे बड़े’ शब्दों को बनाए रखते हुए और सभी छोटे’ शब्दों को हटाकर एक फैक्टराइज्ड स्टेटमेंट को अनुमानित करने के बराबर है
  2. एसवीडी में मान लगातार संख्याएं हैं, और कारककरण उन्हें विघटित करने की प्रक्रिया है, जबकि पीसीए मुख्य पहलुओं को निर्धारित करने के लिए एक सांख्यिकीय/मशीन खुफिया तरीका है।
  3. ऑर्थो-सामान्य क्षेत्रों में मैट्रिक्स के अपघटन को एसवीडी के रूप में जाना जाता है, जबकि पीसीए की गणना एसवीडी का उपयोग करके की जा सकती है, हालांकि इसकी कीमत अधिक है।
  4. एसवीडी डेटा अधिग्रहण के लिए संख्यात्मक रैखिक बीजगणित में सबसे व्यापक रूप से उपयोग की जाने वाली और सर्व-उद्देश्यीय सहायक सुविधाओं में से एक है, जबकि पीसीए एक अच्छी तरह से स्थापित विधि है जिसने आंकड़ों के बारे में बहुत सारे सिद्धांत पेश किए हैं।
  5. एसवीडी प्रमुख एल्गोरिदम में से एक है, जबकि पीसीए एक आयामी कमी दृष्टिकोण है।

निष्कर्ष

खोजपूर्ण डेटा विश्लेषण और मशीन लर्निंग में, एकवचन मूल्य अपघटन (एसवीडी) और प्रमुख घटक विश्लेषण (पीसीए) जैसी आयामी कमी तकनीकों का व्यापक रूप से उपयोग किया जाता है। दोनों पारंपरिक रैखिक आयामीता में कमी की रणनीतियाँ हैं जिनका उद्देश्य प्रारंभिक उच्च-आयामी डेटा मैट्रिक्स में इनपुट के रैखिक सेट को ढूंढकर डेटाबेस की एक प्रतिनिधि तस्वीर तैयार करना है। जब आयाम कम करने की बात आती है, तो उन्हें विभिन्न क्षेत्रों द्वारा चुना जाता है।

एकवचन मूल्य अपघटन (एसवीडी) एकवचन मूल्य अपघटन को संदर्भित करता है; मूल बीजगणित में, मूल्यांकन स्थिर आंकड़े होते हैं, और गुणनखंड अपघटन की प्रक्रिया है। इसलिए, हम निश्चित कारकों का उपयोग करके एक बीजीय व्यंजक को गुणनखंडित करेंगे, जबकि पीसीए डेटा में प्राथमिक पैटर्न का आकलन करने के लिए एक सांख्यिकीय/मशीन इंटेलिजेंस तकनीक है जो कुल भिन्नता को अधिकतम करती है। जब हम विचरण को अधिकतम करने के लक्ष्य को औपचारिक रूप देते हैं, तो हम पाते हैं कि यह प्रारंभिक मूल्य समस्या के समान है: हमें सहप्रसरण मैट्रिक्स के eigenvalues/eigenvectors की पहचान करनी होगी।