ಮೊದಲು ದಾರಿ ಗುರುತಿಸೋಣ
ಲೇಬಲ್ ಇರುವ data ಮತ್ತು ಇಲ್ಲದ data ಆಧರಿಸಿ ಯಾವ learning ದಾರಿ ಯಾವಾಗ ಸೂಕ್ತ ಅನ್ನೋದನ್ನು ಮೂಲವಾಗಿ ತಿಳಿದುಕೊಳ್ಳುತ್ತೀರಿ.
ಯಂತ್ರ ಕಲಿಕೆಯ ಎರಡು ದಾರಿ: ಲೇಬಲ್ ಇರುವ data ಇದ್ದರೆ supervised, ಇಲ್ಲದ data ಇದ್ದರೆ unsupervised — ಯಾವ ಸಂದರ್ಭದಲ್ಲಿ ಯಾವ learning ದಾರಿ ಸೂಕ್ತ ಅನ್ನೋದು ಸ್ಪಷ್ಟವಾಗುತ್ತದೆ. By the end, you'll know: labeled data ಆಯ್ಕೆ, unlabeled data ಬಳಕೆ, problem-fit ತೀರ್ಮಾನ. ಯಂತ್ರ ಕಲಿಕೆಯಲ್ಲಿ ಮೊದಲ ಪ್ರಶ್ನೆ model ಏನು ಮಾಡಬೇಕು ಅನ್ನೋದಲ್ಲ. data ಜೊತೆ ಸರಿಯಾದ ಉತ್ತರ already ಇದೆಯಾ ಇಲ್ಲವಾ ಅನ್ನೋದ್ರಲ್ಲೇ. ಈ ಒಂದೇ check ನಿಂದ supervised ಮತ್ತು unsupervised learning ಬೇರ್ಪಡುತ್ತವೆ. ನಿಮ್ಮ ಬಳಿ ಪ್ರತಿಯೊಂದು input ಗೆ known output ಇದ್ದರೆ, ನೀವು supervised ದಾರಿಗೆ ಹೋಗ್ತೀರಿ. ಉದಾಹರಣೆಗೆ, email ಗೆ spam ಅಥವಾ not spam ಅನ್ನೋ label ಇದ್ದರೆ, model ಗೆ input-output mapping ಕಲಿಸುವ ಕೆಲಸ ಶುರುವಾಗುತ್ತದೆ. ಉತ್ತರ ಇಲ್ಲದ data ಬಂದರೆ, ಅದೇ problem ಬೇರೆ ದಾರಿಗೆ ತಿರುಗುತ್ತದೆ. ಇಲ್ಲಿ ಮುಖ್ಯ point ಏನಂದ್ರೆ, machine learning ಅನ್ನೋದು ಒಂದೇ ತಂತ್ರ ಅಲ್ಲ. data ಯಲ್ಲಿ labels ಇದ್ದರೆ prediction ಕಡೆ ಹೋಗಬಹುದು. labels ಇಲ್ಲದಿದ್ದರೆ structure ಹುಡುಕಬೇಕು. Professional perspective ನಲ್ಲಿ ಇದು important, ಏಕೆಂದರೆ problem ಗೆ ತಪ್ಪು ದಾರಿ ಆಯ್ಕೆ ಮಾಡಿದ್ರೆ objective ಕೂಡ ತಪ್ಪಾಗಿ set ಆಗುತ್ತದೆ. ಹಾಗಾದರೆ ನೀವು data ನೋಡಿ ಏನು predict ಮಾಡ್ತೀರಿ? ಉತ್ತರ available ಇದೆಯಾ, ಅಥವಾ data itself ಮಾತಾಡಬೇಕು ಅಷ್ಟೇನಾ? ಈ distinction clear ಆದ್ಮೇಲೆ, ಮುಂದೆ ಯಾವ model family ನೋಡಬೇಕು ಅನ್ನೋ decision ತುಂಬಾ clean ಆಗುತ್ತದೆ.
