What is Data Science_ _ Completely RoadMap _ Simply Explained
32 views
Jun 1, 2024
This video provides a comprehensive roadmap and a simplified explanation of what data science is all about. It covers the essential concepts, techniques, and tools used in data science, making it accessible for beginners and informative for those looking to deepen their understanding. Whether you're new to the field or curious about its applications, this video serves as an informative guide to the world of data science.
View Video Transcript
0:00
Hi everyone, welcome to Apto College. आज हम बात करने वाले हैं क�
0:02
Data Science exactly होता क्या है और Data Science की field में अगर हम career बनाना चाहते हैं तो उसका क्या step by step path हो सकता ह�
0:10
सबसे पहले बात करते हैं Data Science के बारे में अब हमने Machine Learning जैसी, Artificial Intelligence जैसी चीज़ें सुनी होंग�
0:16
Recent years में and in fact अभी हमने recently Chat GPT को देखा ह�
0:30
करते हैं और उसके ऊपर हम बहुत ज़्यादा हॉरर मूवीज देखते हैं तो नेटफ्लिक्स क्या करेगा अगर कोई नई हॉरर मूवी आई है तो उसे हमें सजेस्ट करेगा तो उन्होंने अक्शली क्या किया हमारे जो पैटर्न्स है यानि हम किस तरीके का कॉंटेंट देख�
1:00
ताकि हम Instagram का जो platform है उसे और ज़ादा use करे�
1:03
तो basically जितने भी platforms होते हैं चाहे वो social media हो गए चाहे वो दूसरे तरीके platforms हो गए चाहे वो shopping platforms हो ग�
1:09
जैसे Amazon ये सारे के सारे platforms चाहते हैं कि ज़ादा time तक user इनके उपर रह�
1:14
और जादा से जादा ही नहीं use करें इसलिए उन्हें चाहिए कि users क�
1:18
जो activity होती है उसके basis पर कुछ ऐसे common patterns निकाले जाए�
1:23
जिसके basis पर users को हम hooked रख सकें अपने platforms प�
1:26
ये तो हो गया एक example इस तरीके के बहुत सारे business problems
1:31
होते हैं जिनके solutions निकाले जाते हैं using data science तो data science को अगर समझना है तो it is a mix of math, statistics, उसके साथ में programming, data and machine learning
1:43
तो कई सारी different different चीज़ें हैं जिनका mixture अगर निकालें तो वो data science हो जाता ह�
1:48
data science के अंदर ही हमारे machine learning jobs आ जाते हैं इसी के अंदर हमारे data yst के jobs आ जाते है�
1:54
इसी के अंदर हमारे big data पर based जो jobs होते हैं, वो आ जाते हैं, अब आज की date में हमें पता है कि
1:59
बहुत बड़ी-बड़ी companies हैं, और उनके पास बहुत जादा data है, तो जो कोई बड़ी company होती है
2:04
उसके data को हम सिर्फ data नहीं कहते है, उसको हम big data कह देते है, क्योंकि companies के पास आज की date में इतना सारा data ह�
2:11
अब data scientist का काम होता है सबसे पहला तो यह जो data होता ह�
2:14
इसको collect करना फिर इसको yze करना फिर इसको process करना और उसके बाद finally इस data से कुछ useful insights निकालन�
2:23
useful insights मतलब useful information निकालना ऐसी information जो उनकी company के काम आ सके, जिससे वो अपने users को और अच्छे better तरीके से help कर सके, या फिर अपने platform को और ज़्यादा grow कर सके, तो इस तरीके से business skills को जब हम algorithm और data skills और math के साथ mix कर देते हैं, तो हमारे पास field आती है, data science की field, अब data scientist बनने के लिए हमारे पास कई सारे steps होते हैं, �
2:57
math computer science data science time invest actually skills career
3:15
अब सबसे पहला step जो इस journey के अंदर आता है वो है to learn a programming language
3:19
generally data science के अंदर दो major programming languages होती है एक होती है python, एक होती है r
3:25
अब python इन में से सबसे जादा popular है क्यों क्योंकि इसके अंदर libraries
3:29
बहुत अच्छी available है, इसके अंदर resources बहुत अच्छे-अच्छे available है, तो सबस�
3:33
पहले तो हमें basics of python सीखना पड़ेगा basics of python में हमार�
3:37
variables आ जाते हैं, हमारे if-else आ जाते हैं, हमारे loops आ जाते हैं, तो इस तरीक�
3:41
की basic-basic चीजें हमें पहले Python के अंदर सीखनी पड़ेगी, और उसके बाद हमे�
3:45
दो libraries सीखनी हैं Python के अंदर, एक है हमारी numpy, और एक है हमार�
3:49
pandas, ये libraries हमें help करती हैं data के साथ deal करने में कि कैसे python क�
3:53
अंदर हम data के साथ interact कर सकते हैं अब अगर basic python हमें सीखने है तो उसके लि�
3:57
already हमने एक one shot बनाया हुआ है उसको जाकर आप explore कर सकते हैं उस one shot
4:01
के अंदर basics of python cover है और उसके बाद numpy and pandas
4:05
हमें अलग से जाकर सीखना पड़ेगा अब यहाँ पर जो हम Python सीख रहेंगे उन पूरी Python नहीं होगी इसमें सिफ हम Basics और कुछ Basic Libraries को Cover करेंगे उसके बाद Second Step आ जाता है To Learn Some Statistics अब हो सकता है हमने सिफ 10 तक ही Math पढ़ी हो तो उसके बाद एक दो Extra Topics है Math के अंदर जिनको हमें पढ़ना पढ़ेगा To Become A Good Data Scientist और अगर मान �
4:37
प्रूशियल रोल प्ले करता है पर इसमें हमें यह नहीं करना कि मैट के सिर्फ फॉर्मुले याद कर लिए एक्ट्रल अंडरस्टैंडिंग जरूरी है उन सारी चीजों की जो डेटा साइंस के अंदर आती हैं क्योंकि अगर हम इस चार्ट को देखें तो रीसेंट येर्स में �
5:07
आपका बारा काम चल सकता है अब मैथ के अंदर चार मेजर टॉपिक्स है जिनको हम कवर करते हैं जिसमें सबसे पहला होता है स्टेटिस्टिक्स दूसरा होता है लीनियर एलजेब्रा तीसरा हमारे पास आ जाता है कैलकुलिस और चौथा हमारे पास है प्रॉबेबिलिटी अ�
5:37
नहीं है चीजों को, but actually समझना है कि data के साथ ये सारी की सार�
5:41
चीजे कैसे relate करती है, और data के अंदर अगर हम mean निकाल रहे है�
5:45
calculate करके, तो उस mean का actual मतलब क्या होता है, linear algebra के अंद�
5:49
हम vectors जैसे, matrices जैसे, eigen values जैसे topics को पढ़ेंगे, अब इन सार�
5:53
topics list description box already extensive list download topic third calculus calculus derivatives dy by dx term actual math probability probability odds conditional probabilities base theorem important use practically basics of math statistics probability calculus linear algebra topics cover
6:42
जब हम companies के अंदर काम करते हैं, तो हम तो data scientist बन जाएंगे, पर दूसरे लोग हमारे data के अंदर
6:47
जो insights हमने निकाले हैं, जो pattern हमने डूंड के निकाले हैं, उसे कैसे समझ पाएंगे
6:51
वो उसे समझ पाएंगे, using graphs, charts, तो इस तरीके की चीज़ें बनाने के लिए हमें data visualization सीखना पड़ेग�
6:57
इसको सीखने के लिए हम कवर करेंगे python के अंदर दो काफी famous libraries एक है हमारी matplotlib और दूसरी है हमारी seaborn
7:03
इनको हमें अच्छे से यूज़ करना आना चाहिए और उसके साथ साथ हमें अगर basic excel की knowledge होगी तो वो भी काफी अच्छा होग�
7:10
क्योंकि अगर कोई small scale का data होता है तो उसे थोड़ा सा present करने के लिए हम अपनी excel sheets को use करते है�
7:15
अब बहुत ज़्यादा extreme level पे excel को कोई course लेने की ज़रूरत नहीं है बहुत basic level of excel हम सीख सकते है�
7:20
जिसको खुदी use करके हम सीख पाएंगे अब अगर मान लेते हैं data visualization के अंद�
7:25
हमें और जादा advanced level की चीजें सीखनी हैं तो उसमें हम और जाद�
7:28
अच्छे tools सीख सकते हैं जैसे power BI होगा जैसे tablo हो गया बट अगर हम ए�
7:32
fresher हैं तो college के अंदर दोनों tools को हम ignore कर सकते हैं इनको वैसे भ�
7:36
अगर हम data yst के job में जाते हैं तो वहाँ पर हम job के अंदर सीख रहे होंगे and
7:40
फिर fourth step आ जाता है machine learning का यानि actually data के उप�
7:44
machine learning की algorithms apply करना ML algorithms में हमारे पास 4 major
7:48
types of algorithms होती हैं जिनमें से पहली होती है supervised दूसरी होती है, unsupervised तीसरी होती है
7:52
सेबी supervised, and fourth होती है reinforcement learning. अब ये different different types of algorithm हम इनके अंदर सीख सकते हैं
7:58
और फिर वो उन algorithms को हम data के उपर apply करके देख सकते हैं
8:02
अब machine learning कैसे सीखनी है, कहां से शुरुवात करनी है, किस तरीके का process होगा, क्या resources होगे
8:07
उसके उपर already हमने dedicated videos बनाए हुए हैं अब उनको जाकर explore कर सकते है�
8:12
अब जब भी हम ML algorithms को data के उपर apply करते हैं तो बहुत important है कि हम अच्छे data के उप�
8:18
उन machine learning algorithms को apply करें ऐसे में सबसे पहले हमें data के साथ deal करना आना चाहि�
8:23
कि data store कहा हो रहा है, किस तरीके से उसको handle करना है तो यहाँ पर सिफ ML की knowledge होना काफी नहीं है, हमें database की knowledge होना भी काफी ह�
8:31
तो इसलिए database के साथ अगर हम SQL की भी knowledge ले लेते हैं, तो वो हमारे लिए काफी जादा plus point हो जाता ह�
8:36
इसलिए कई सारे जो data scientist के interviews होते हैं उनमें आपसे SQL के भी सवाल पूछे जा सकते है�
8:42
अब हमने already एक SQL का dedicated complete course बनाया है वो YouTube के उपर आप चाहें तो उसको जाकर भी explore कर सकते है�
8:48
नहीं तो आप किसी भी resource से जाकर SQL के basic concepts को पढ़ सकते है�
8:51
knowledge important knowledge projects form practice projects famous website data science which is called Kaggle Kaggle different project ideas data sets field theoretical field practically implement better and second major
9:51
अंदर हेल्प कर रहे होंगे एंड प्रोजेक्ट के साथ हमारे पास अच्छा होगा कि अगर हम गिट की नॉलेज भी ले लेता ह�
9:56
क्योंकि एक बार अगर अगर हमने प्रोजेक्ट बना लिए तो प्रोजेक्ट को शोकेस करने के लिए या दूसरे लोगों के प्रोजेक्�
10:02
देखने के लिए हमारे पास एक website होती है GitHub नाम से जिसके अंद�
10:05
Git एक tool होता है उसके concepts use होते हैं अब यह हो सकता है शुरुआत में थोड़ी स�
10:09
अजीव सी terms लग रही हूँ या नई नई terms लग रही हूँ पर इनसे घबराने की ज़रूरत नहीं है बहु�
10:13
basic चीजे है, already हमने git and github को completely cover करते हुए एक tutorial
10:18
बनाया हुआ है, आप चाहें तो उससे जाकर भी git and github को सीख सकते हैं, नहीं तो directly
10:21
आप github पे अपना account बना सकते हैं और जो भी projects आप बनाएंगे, उनको वहाँ पर जाक�
10:25
आप host कर सकते हैं, तो यह basic हमारा five step road map था to go in the field of data science
10:30
अब मान लेते हैं हमने ये सारी चीज़ें सीख ली तो उसके बाद हमारे पास choice होगी कि इन में से किसी में भी हम specialization कर सकते है�
10:37
जिसे मान लेते हैं data science की field के अंदर कई सारे different different parts हैं एक है algorithms का part जिसके अंदर machine
10:42
learning algorithms होती है, एक खुद data अपने आप में बहुत बड़ी चीज होती है
10:46
हमारे पास big data होता है, तो data lakes होती है, data warehouses होते हैं
10:50
इतने बड़े-बड़े data को store कराने के लिए, इसमें एक part हमारा business side भी होता है
10:54
यानि हमारे business skills कि अगर हमने data से insights निकाल लिये, patterns निकाल लिये
10:58
तो उसको कितना अच्छे से हम company की growth में apply कर सकते हैं
11:02
तो जिस भी part में हमें सबसे जादा interest आता है, हम उसके अंदर specialization कर सकते हैं
11:06
अगर हमें data के अंदर जादा interest आ रहे हैं, तो हम big data के अंदर specialization कर सकते हैं
11:10
अगर हमें algorithms के अंदर interest आ रहे हैं, तो machine learning के बाद हम deep learning algorithms के अंदर सीख सकते हैं, हम neural networks को, artificial neural networks को explore कर सकते हैं, CNN जैसे networks को explore कर सकते हैं, अगर मान लेते हैं हमें business side में सबसे जादा interest आ रहे हैं, तो फिर हम और जादा better advanced visualization tools को देख सकते हैं, तो data science ऐसी field है, जिसके अंदर सिर्�
11:40
machine learning या deep learning का बहुत जादा role है, उसके अंदर कई सारी companies जैसे Google हो गई, Microsoft हो गई, वो require करते हैं कि आपके पास already या तो Masters या PhD हो, तो अगर हम data science field के अंदर specially algorithms के अंदर जाना चाते हैं, या big data side के अंदर जाना चाते हैं, तो उसमें अगर हमारा actual interest है, तो हम consider कर सकते हैं कि over the years हम �
12:10
आज हमें थोड़ी बहुत clarity मिली होगी कि अगर हमें data science की field में career बनाना ह�
12:15
तो क्या-क्या steps होंगे जिनको हमें लेना पड़ेगा, किन-किन चीजों को, किन-किन resources को हमें follow करना पड़ेग�
12:20
और कौन कौन सी चीज़े हैं जो over the years हम ध्यान रख सकते हैं अगर हम इस field के अंदर जा रहे हैं त�
12:24
इसके अलावा technology से related अगर आपका कोई भी doubt है या college से related कोई भी doubt है तो उसके बारे में आप मुझे नीचे comment करके बता सकते है�
12:31
आज के लिए इतना ही, मिलते हैं next video में, till then keep learning and keep exploring
#Computer Science
#Data Management
#Enterprise Technology
#Machine Learning & Artificial Intelligence
#Mathematics
#Statistics
#Web Stats & Analytics