Share

Data Scientist Internship @AIGEN by น้องปัน

สวัสดีครับ ผม ปัน กำลังศึกษาอยู่คณะวิศวกรรมศาสตร์ ภาควิชาคอมพิวเตอร์ จุฬาลงกรณ์มหาวิทยาลัยครับ ตอนนี้ผมอยู่ชั้นปีที่ 3 และได้มาฝึกงานที่ AI GEN ในช่วง Summer ครับผม

ทำไมถึงอยากฝึกงานกับ AI GEN ?

อย่างแรกเลยคือ ผมสนใจในสายงานของ Data และอยากที่จะเอา Data ต่าง ๆ มาสร้าง Model โดยทาง AI GEN เป็นบริษัทฯ ที่ทำเกี่ยวกับเรื่องนี้โดยตรง ตอบโจทย์กับสิ่งที่ผมสนใจครับ อย่างที่สองคือผมอยากฝึกงานในบริษัท Startup เพราะคิดว่าการที่มาฝึกงานในบริษัท Startup จะได้ลงมือทำจริง ๆ และได้เห็นภาพรวมการทำงานในมุมกว้าง

ตำแหน่งที่ฝึกงาน

ผมได้ฝึกในตำแหน่ง Data Scientist ซึ่งหน้าที่หลัก ๆ ของตำแหน่งนี้ก็จะทำ Visualize Data, Prepare Data และ Modelling ครับ

งานที่ได้รับมอบหมาย

สำหรับโปรเจคที่ผมได้รับมอบหมาย คือ โปรเจค Car Collision ซึ่งจะทำ Model ในการประเมินราคาค่าซ่อมรถยนต์แต่ละคัน โดยจะมีการ  Update Progress ให้พี่ในทีมฟังทุก ๆ 2-3 วัน และมีการอัพเดทใหญ่ให้พี่ ๆ จากทีมอื่น ๆ ฟังทุก ๆ 2-3 สัปดาห์ ซึ่ง Process ที่ในทีม Follow ตามก็จะเป็น CRISP-DM โดยเริ่มตั้งแต่ Business Understanding, Data Understanding, Data Preparation, Modelling, Evaluation และ Deployment

Overview of CRISP-DM
Source : https://towardsdatascience.com/using-crisp-dm-to-grow-as-data-scientist-a07ce3fd9d56

ช่วงแรกที่ยังไม่ได้ข้อมูล พี่ ๆ ก็จะให้ไปศึกษาพวก Model ต่าง ๆ ที่จะนำมาใช้ รวมถึงการ Encode ข้อมูลด้วยวิธีต่าง ๆ ด้วย แล้วมา Update ให้พี่ฟังครับ และหลังจากได้ข้อมูลแล้ว สิ่งแรกที่ผมทำ ก็คือการทำความเข้าใจข้อมูล ซึ่งข้อมูลที่มีก็จะมีทั้งข้อมูลที่เป็น Numerical เช่น CC ของรถยนต์ Categorical เช่น รุ่นของรถยนต์ และส่วนสุดท้ายคือ Text โดยจะเป็นข้อมูลชื่อชิ้นส่วนรถยนต์แต่ละชิ้น

หลังจากนั้น ผมก็ได้เตรียมข้อมูลสำหรับนำไป Train Model ซึ่งก็จะมีการตัด Outlier ทำ Scaling และ OneHot Encoding ส่วน Text ก็จะทำ Edit Distance ซึ่งเป็นการแก้คำผิดให้เป็นคำที่ถูกที่ใกล้เคียงที่สุด และทำ Porter Stemming ซึ่งจะแปลงคำแต่ละคำให้เป็นคำรากศัพท์

ในส่วนของการ Train Model ผมก็ได้ลองกับ Boosting Tree (LightGBM, XGBoost) และ Neural Network ซึ่งผลลัพท์ที่ได้ก็จะอยู่ที่ประมาณ 12% MAPE ครับ

ประสบการณ์และความประทับใจต่าง ๆ ที่ได้รับจาก AI GEN

ผมได้รับความรู้เรื่องใหม่ ๆ เพิ่มขึ้นเยอะมาก หลายสิ่งที่ผมไม่เคยทำมาก่อนก็ได้มาลองทำที่นี่ครั้งแรกครับ แล้วพี่ ๆ ก็ให้ความช่วยเหลืออย่างเต็มที่เลยครับ มีคำถามอะไรสงสัย พี่ ๆ ก็ช่วยอธิบายให้ผมเข้าใจครับ แล้วก็ที่สำคัญเลยคือพี่ ๆ ที่นี่เปิดกว้างกับไอเดียมาก ๆ สามารถเสนอไอเดียใหม่ ๆ ให้พี่ ๆ ฟังได้เสมอครับ

สุดท้ายนี้…

สำหรับใครที่สนใจด้าน Data Sci. หรือ Machine Learning ผมแนะนำให้ลองมาฝึกงานที่ AI GEN ครับ เพราะว่าทุกคนจะได้พัฒนา Skill ในด้านนี้อย่างแน่นอนครับผม

บรรยากาศภายในออฟฟิศ
โต๊ะทำงานในช่วง Work From Home
AIGEN Live chat