Data scientist l Data Analyst และ Machine learning Engineer มีความเหมือนและแตกต่างกันอย่างไร?
หลาย ๆ คนอาจกำลังสับสนว่า Data Scientist, Data Analyst, Machine Learning Engineer 3 อาชีพนี้มีความเหมือนหรือแตกต่างกันอย่างไร ? สายงานไหนที่เหมาะสมกับคุณมากกว่า ? วันนี้ AI GEN มีคำตอบ !
Data Science, Data Analytic และ Machine Learning เป็นหนึ่งของสาขาเทคโนโลยีและการใช้ข้อมูลเพื่อสร้างและพัฒนาผลิตภัณฑ์ บริการ ระบบโครงสร้างพื้นฐาน ฯลฯ ซึ่งเป็นสายอาชีพที่เป็นที่กำลังเป็นที่ต้องการของตลาดโลกในปัจจุบัน บริษัทต่าง ๆ กำลังมองหาผู้เชี่ยวชาญที่จะสามารถนำข้อมูลไปวิเคราะห์และพัฒนาต่อ เพื่อให้พวกเขาสามารถขับเคลื่อนการตัดสินใจทางธุรกิจได้อย่างรวดเร็วและมีประสิทธิภาพมากขึ้น โดย IBM ได้คาดการณ์เอาไว้แล้วว่าตั้งแต่ปี 2020 งานที่เกี่ยวข้องกับผู้เชี่ยวชาญด้านข้อมูล (Data) จะเพิ่มขึ้นอย่างจาก 364,000 เป็น 2,720,000 ตำแหน่ง ในสหรัฐอเมริกา รวมถึงทั่วโลก
อย่างไรก็ตาม Data Scientist, Data Analyst, Machine Learning Engineer เป็นคำศัพท์อาชีพที่หลาย ๆ คนมักสับสนและสามารถใช้สลับกันได้เมื่อพูดถึงการจัดการกับข้อมูล (Data) ถึงแม้ว่าทั้ง 3 อาชีพนี้จะมีคุณสมบัติที่คล้ายกัน แต่มีลักษณะการทำงานที่แตกต่างกันอย่างสิ้นเชิง
Data Science คืออะไร ?
ปัจจุบันในโลกของการทำงานและธุรกิจมีข้อมูล (Data) มากมาย และกระบวนการนำข้อมูลเหล่านี้มาวิเคราะห์ผลและใช้ประโยชน์คือกระบวนการทาง Data Science และข้อมูลมีหลายหลายรูปแบบเช่น ข้อมูลจากตาราง วิดีโอ ภาพ และเสียง ซึ่งกระบวนการที่นำข้อมูลเหล่านี้มาวิเคราะห์ผลและใช้ให้เกิดประโยชน์ได้โดยใช้อัลกอริทึมการเรียนรู้ของเครื่อง (Machine Learning) วิธีทางสถิติ (Statistical Methods) การวิเคราะห์ทางคณิตศาสตร์ (Mathematical Analysis) เพื่อดึงความรู้จากข้อมูลต่าง ๆ ทั้งข้อมูลที่มีโครงสร้าง และไม่มีโครงสร้าง (Structured and Unstructured Data)
โดย Data Science เป็นส่วนสำคัญของหลากหลายอุตสาหกรรม เพราะการทำงานกับข้อมูลจะช่วยให้บริษัทต่าง ๆ เข้าใจลูกค้าได้ดียิ่งขึ้น รวมทั้งเพิ่มประสิทธิภาพกระบวนการทางธุรกิจ และนำเสนอผลิตภัณฑ์ที่ดีขึ้น โดยทำการวิเคราะห์ข้อมูลที่เกี่ยวข้องกับธุรกิจและใช้ข้อมูลเหล่านั้นมาแก้ไขปัญหาตามที่บริษัทต้องการ ซึ่งเราจะเรียกคนที่ทำงานด้าน Data science ว่า Data scientist หรือนักวิทยาศาสตร์ข้อมูลนั่นเอง
ลักษณะการทำงานของ Data Scientist (DS)
- วิเคราะห์ข้อมูลที่เกี่ยวข้องกับธุรกิจ และนำเสนอวิธีการที่สามารถแก้ปัญหาและตอบโจทย์ทางธุรกิจ
- พัฒนากระบวนการและเครื่องมือในการตรวจสอบ และวิเคราะห์ประสิทธิภาพของแบบจำลอง รวมถึงความถูกต้องของข้อมูล
- สร้างภาพข้อมูลเชิงลึก (Eye-pleasing visualization)
- ทำงานร่วมกับ Machine Learning Engineer , Data Engineer และทีมเทคนิคอื่น ๆ
ทักษะที่จำเป็นของ Data Scientist (DS)
- มีความรู้ด้านการเขียนโปรแกรมภาษา Python, R, SAS และอื่น ๆ ได้เป็นอย่างดี
- ความคุ้นเคยในการทำงานกับข้อมูลที่มีโครงสร้าง และไม่มีโครงสร้าง
- มีความสามารถในการประมวลผล และวิเคราะห์ข้อมูลที่เป็นที่ต้องการทางธุรกิจ
- มีความเข้าใจคณิตศาสตร์ สถิติ และความน่าจะเป็น
- มีความสามารถในเรื่องของการทำ Data visualization และ Data wrangling
- ความรู้เกี่ยวกับอัลกอริธึม Machine Learning และ Deep Learning
- มีทักษะการสื่อสารและการทำงานเป็นทีมที่ดี
Data Analytics คืออะไร ?
Data Analytics เป็นสาขาที่ศึกษาวิธีการรวบรวม ประมวลผล และตีความข้อมูล ซึ่งการวิเคราะห์ข้อมูลนั้น ๆ มักถูกใช้ในบริษัทขนาดใหญ่ที่ได้รวบรวมข้อมูลมหาศาลเกี่ยวกับลูกค้าของตนและใช้แนวทางที่ขับเคลื่อนด้วยข้อมูลเพื่อทำให้ผลิตภัณฑ์และบริการของตนดีขึ้น โดยใช้ชุดข้อมูลหรือเครื่องมือจาก Data Science ในการวิเคราะห์หาคำตอบที่มีความเฉพาะเจาะจง (Insight) มากกว่า ซึ่งเราจะเรียกคนที่ทำงานด้าน Data Analytics ว่า Data Analyst หรือนักวิเคราะห์ข้อมูล
ลักษณะการทำงานของ Data Analyst (DA)
- รู้จักเครื่องมือในการวิเคราะห์ เช่น Microsoft Excel® SQL SAS® software Google Analytics ™ Google Tag Manager Tableau™ Google AdWords™
- ระบุข้อมูลและเก็บรวบรวมข้อมูลที่จะต้องวิเคราะห์
- ตรวจสอบข้อมูล (Data Cleaning) เพื่อเตรียมพร้อมในการวิเคราะห์
- ตีความและวิเคราะห์หา Insight ที่จำเป็นต่อการทำงานในองค์กร
- วิเคราะห์ข้อมูลที่เกี่ยวข้องกับธุรกิจ (insight) และนำเสนอวิธีการที่สามารถแก้ปัญหาและตอบโจทย์ทางธุรกิจ
ทักษะที่จำเป็นของ Data Analyst (DA)
- ความรู้ทางสถิติคณิตศาสตร์
- มีความรู้ด้านการเขียนโปรแกรมภาษา R and Python
- มีประสบการณ์เกี่ยวกับการสืบค้นฐานข้อมูลโดยใช้ R, Python, SQL เป็นต้น
- หากมีประสบการณ์เกี่ยวกับบริการระบบคลาวด์สาธารณะ (AWS, GCP, Azure) หรือการพัฒนาเว็บไซต์จะได้รับการพิจารณาเป็นพิเศษ
- มีความเข้าใจเกี่ยวกับ RedShift, Elastic, Kafka, Tableau, Hadoop & Hive, Apache Spark หรือเทคโนโลยีที่เกี่ยวข้อง
Machine Learning หรือ Machine Learning Engineer คืออะไร ?
Machine Learning เป็นสาขาหนึ่งของวิทยาการคอมพิวเตอร์ที่ศึกษาวิธีทำให้คอมพิวเตอร์สามารถ “เรียนรู้” และ “แก้ไขปัญหา”ซึ่งมุ่งเน้นไปที่เครื่องมือและเทคนิคในการสร้างแบบจำลอง (Model) ที่สามารถเรียนรู้ได้ด้วยตนเองโดยใช้ข้อมูลที่มีอยู่ โดยเราจะเรียกคนทำงานสายนี้ว่า Machine Learning Engineer
Machine Learning สามารถใช้อัลกอริทึมเพื่อดึงข้อมูล เรียนรู้ และคาดการณ์แนวโน้มในอนาคตของสิ่งนั้น ๆ โดยซอฟต์แวร์ของ Machine Learning จะใช้การวิเคราะห์ทางสถิติและการวิเคราะห์เชิงคาดการณ์ที่เพื่อการระบุรูปแบบและค้นหาข้อมูลเชิงลึกที่ซ่อนอยู่ตามข้อมูลที่ได้รับ
หากจะยกตัวอย่างให้เห็นภาพที่สุด ก็คงจะเป็นการนำ Machine Learning ไปใช้กับ Social Media ชื่อดังอย่าง Facebook โดยอัลกอริทึมของ Facebook จะรวบรวมข้อมูลพฤติกรรมของผู้ใช้งานทุกคนบนแพลตฟอร์มโซเชียลมีเดีย จากนั้นอัลกอริทึมจะคาดการณ์ความสนใจและแนะนำบทความ รวมถึงการแจ้งเตือนบนฟีดข่าวโดยอิงจากพฤติกรรมในอดีต เช่นเดียวกันกับวิธีการที่ Amazon ได้แนะนำผลิตภัณฑ์ที่คุณอาจจะสนใจ หรือเมื่อ Netflix ได้แนะนำภาพยนตร์ที่คุณอาจจะอยากดู โดยอ้างอิงจากพฤติกรรมในอดีต โดยใช้ Machine Learning ในการเรียนรู้นั่นเอง
ลักษณะการทำงานของ Machine Learning Engineer (ML Engineer)
- พัฒนาการเรียนรู้เชิงลึก (Deep Learning) และอัลกอริทึมของ Machine Learning
- ทำงานร่วมกับทีมข้อมูล เพื่อรับข้อมูลที่ได้รับการตรวจสอบหรือทำการ Label มาแล้ว
- ทำงานร่วมกับทีม developer เพื่อนำสิ่งที่พัฒนาไปปรับใช้กับแอปพลิเคชัน
ทักษะที่จำเป็นของ Machine Learning Engineer (ML Engineer)
- มีความรู้และประสบการณ์ในการเขียนโปรแกรมภาษา Python และโปรแกรมที่เกี่ยวกับ Machine Learning และ Deep Learning หรือโปรแกรมอื่นๆ
- มีความเข้าใจเกี่ยวกับ NLP หรือ machine vision
- หากมีประสบการณ์เกี่ยวกับบริการระบบคลาวด์สาธารณะ (AWS, GCP, Azure) หรือการพัฒนาเว็บไซต์จะได้รับการพิจารณาเป็นพิเศษ
สรุป
ถึงแม้ว่า 3 สิ่งนี้จะมีคุณสมบัติที่คล้ายกัน แต่มีลักษณะการทำงานที่แตกต่างกัน หากจะให้กล่าวถึงความแตกต่างระหว่าง 3 อย่างนี้อย่างง่าย คงกล่าวได้ว่า งานด้าน Data Science คือการวิเคราห์ข้อมูลตั้งแต่ data ขนาดเล็กไปจนถึงขนาดใหญ่ (Big Data) เพื่อที่จะนำไปใช้ประโยชน์ให้กับองค์กรหรือลูกค้า โดย Data Analytics และ Machine Learning เปรียบเสมือนหนึ่งในเครื่องมือที่ใช้ในงานด้าน Data Science โดย Data Analytics เน้นการวิเคราะห์ข้อมูลหา Insight ต่าง ๆ เพื่อหาโซลูชันที่ดีที่สุดต่อองค์กร และ Machine Learning คือการสร้างเครื่องมือที่เรียนรู้ด้วยตัวเองและนำไปใช้แก้ปัญหาที่เราต้องการ ดังนั้น หน้าที่งานของ Data scientist, Data analyst และ Machine learning Engineer ล้วนมีความเกี่ยวข้องที่ต้องทำงานร่วมกัน โดยใช้ทักษะ และความเชี่ยวชาญของแต่ละหน้าที่งาน เพื่อช่วยกันพัฒนาโซลูชันออกมาให้ได้ตามวัตถุประสงค์ และตอบโจทย์ของแต่ละธุรกิจนั่นเอง
AIGEN บริษัทชั้นนำด้านเทคโนโลยี AI & Machine learning ที่กำลังมาแรงในปัจจุบัน ยินดีต้อนรับคนยุคใหม่ไฟแรงที่พร้อมจะมาทำงานในบรรยากาศแบบ Start-up มีอิสระทางความคิด มีอิสระในการทำงาน พร้อมด้วยสวัสดิการดี ๆ ที่ตอบโจทย์คนยุคใหม่โดยเฉพาะ สนใจมาร่วมงานกับเรา สามารถดูตำแหน่งที่เรากำลังเปิดรับสมัครได้ที่ Link
แหล่งที่มา
https://www.simplilearn.com/data-science-vs-data-analytics-vs-machine-learning-article
https://serokell.io/blog/data-science-vs-machine-learning
https://www.coraline.co.th/single-post/2019/07/15/how-is-the-machine-learning-engineer-different-from-the-data-scientist
https://www.coursera.org/articles/data-science-vs-machine-learning
https://www.rasmussen.edu/degrees/technology/blog/what-does-a-data-analyst-do/