ในปี 2011 คอมพิวเตอร์ Watson ของ IBM ชนะการแข่งตอบปัญหากับแชมป์ของรายการ Jeopardy ที่เป็น มนุษย์ ต่อมาในปี 2016 AlphaGo ของ DeepMind Technologies สามารถเอาชนะแชมป์เกม Go หลายคน แสดงให้เห็นถึงศักยภาพของ AI และ Machine Learning ในการเรียนรู้และตัดสินใจที่เทียบเท่า หรืออาจดีกว่า มนุษย์ ซึ่งแน่นอนว่า การเรียนรู้และตัดสินใจดังกล่าว จะไม่ได้ถูกจํากัดไว้เพียงโลกของเกม แต่จะสามารถ นํามาใช้ช่วยในการตัดสินใจแทนคน ทั้งการทํางาน การวางแผน การแก้ปัญหาในชีวิตจริงในที่สุด
จริงๆ แล้วคําว่า AI และ Machine Learning มักจะถูกใช้แทนกันเสมอๆ แต่จริงๆ แล้ว AI มีความหมายกว้าง กว่า Machine Learning ซึ่งเป็นเพียงหัวข้อหนึ่งภายใต้ AI เนื่องจากการเรียนรู้ของเครื่องจักรเป็นองค์ประกอบ หนึ่งของการพัฒนาไปสู่ปัญญาประดิษฐ์ (AI) ที่แท้จริง และถึงแม้ว่า Machine Learning จะฟังดูเป็นนวัตกรรม ใหม่ที่เพิ่งจะมีการพัฒนาในช่วงไม่กี่ปีที่ผ่านมา แต่ที่จริงแล้ว Arthur Samuel ผู้เชี่ยวชาญด้านคอมพิวเตอร์ และปัญญาประดิษฐ์ มีการพูดถึง Machine Learning มาตั้งแต่ปี 1959
โดยปกติแล้ว โปรแกรมเมอร์จะเป็นผู้กําหนดให้คอมพิวเตอร์ทํางานอัตโนมัติตามโปรแกรมที่เขียน แต่สําหรับ Machine Learning คอมพิวเตอร์จะสร้างโปรแกรมที่ตรงกับข้อมูลที่ป้อนให้นั้นขึ้นมาเอง แล้วคอมพิวเตอร์จึงนําโปรแกรมที่สร้างขึ้นมานั้นไปใช้ในการหาคําตอบต่อไปดังที่แสดงในแผนภาพที่ 1 ทั้ง Machine Learning และ วิชาสถิติ ต่างมีเป้าหมายเดียวกัน คือ “การเรียนรู้จากข้อมูล” (Learning from data) โดยที่ Machine Learning จะใช้เทคนิคทางสถิติ (Statistics) ในการสร้างความสามารถให้คอมพิวเตอร์ เกิดการ “เรียนรู้” จากข้อมูลโดยปราศจากการสร้างโปรแกรมให้แต่ต้น (without being explicitly programmed)
ประเภทของ Machine Learning สามารถแบ่งออกได้เป็น 3 กลุ่มใหญ่ๆ คือ 1. Supervised learning ซึ่งเป็น การสอนคอมพิวเตอร์จากข้อมูลตัวอย่าง และ ผลลัพธ์ที่เรากําหนด (Label) เพื่อให้คอมพิวเตอร์สามารถตอบ ผลลัพธ์ของข้อมูลชุดใหม่จากตัวอย่างที่ให้ไป 2. Unsupervised learning ซึ่งเป็นการให้ข้อมูลไปจัดการโดย เราไม่ได้สอนผลลัพธ์แก่คอมพิวเตอร์ (ไม่มี Label หรือกฎที่ตายตัว) และ 3. Reinforcement learning ซึ่งเป็น ชุดคําสั่ง (Algorithm) ที่ช่วยให้ AI ตัดสินใจตรงกับเป้าหมาย ที่เราตั้งเอาไว้ โดยการใช้รางวัลหรือแรงจูงใจมา ช่วย ซึ่งแนวคิดจํานวนมากที่ Machine Learning ใช้จะมีพื้นฐานจากเทคนิคทางสถิติ เช่น Curve fitting โดย ศาสตราจารย์ Robert Tibshirani จากมหาวิทยาลัยสแตนฟอร์ด พูดถึง Machine Learning ว่าเป็น “glorified
statistics"
ดังนั้น คําถามสําคัญคือ Machine Learning แท้จริงแล้วมีความแตกต่างกันจาก สถิติ (Statistics) หรือไม่ อย่างไร จริงๆ แล้วทั้งสองสิ่งนี้มีความเชื่อมโยงกันค่อนข้างมาก และมีกลไกภายใต้การทํางานที่คล้ายคลึงกัน แต่สิ่งที่ต่างกันคือ วัตถุประสงค์ การนําไปใช้งาน การประยุกต์ใช้และข้อควรระวังต่างๆ
ประเด็นที่สําคัญที่สุดคือ ความแตกต่างกันในเรื่องวัตถุประสงค์ของ Machine Learning กับ สถิติ ซึ่ง Machine Learning นั้น ถูกสร้างขึ้นมาเพื่อให้การพยากรณ์หรือคําทํานายจากข้อมูลมีความแม่นยําสูงสุด (Best possible accuracy) โดยไม่มีการตั้งสมมติฐานเกี่ยวกับความสัมพันธ์ระหว่างตัวแปรต่างๆ ซึ่งเราเพียงแค่ป้อน ข้อมูลจํานวนมากเข้าไป ชุดคําสั่งคอมพิวเตอร์ก็จะประมวลผล และหารูปแบบของข้อมูลซึ่งเราสามารถนําไปใช้ พยากรณ์ตัวแปรต่อไป โดยไม่สนใจการอธิบายความสัมพันธ์ต่างๆระหว่างตัวแปร ยกตัวอย่างเช่น ในกรณีการ คิดเบี้ยประกันภัยรถยนต์ อาจจะมีการติดตั้งแอปพลิเคชั่นบนมือถือของผู้ขับขี่ ซึ่งจะเก็บข้อมูลตัวแปรต่างๆ ที่ได้ จากเซ็นเซอร์ของมือถือโดยอัตโนมัติ ก่อนนําไปสร้างและปรับแบบจําลองที่จะคิดคํานวณราคาเบี้ยประกัน โดยไม่ได้พิจารณาถึงเหตุผลหรือความสัมพันธ์ของอัตราการเคลมกับค่าตัวแปรที่เก็บข้อมูลโดยโทรศัพท์
ในส่วนของแบบจําลองทางสถิติ ที่ถึงแม้จะสามารถทําการพยากรณ์ หรือให้คําทํานายโดยอาศัยข้อมูล เช่นเดียวกับ Machine Learning แต่โดยทั่วไปแล้ว แบบจําลองทางสถิติถูกออกแบบมาเพื่ออนุมาน หรืออธิบายความสัมพันธ์ระหว่างตัวแปลเป็นหลัก โดยนักสถิติจําเป็นต้องเข้าใจมิติต่างๆ ของข้อมูล ทั้งวิธีการเก็บ ข้อมูล คุณสมบัติทางสถิติของข้อมูล การกระจายตัวของกลุ่มตัวอย่าง ฯลฯ เพื่อให้มีความเข้าใจความสัมพันธ์ ของตัวแปรแบบจําลอง ในขณะที่ความแม่นยําไม่ถือเป็นประเด็นสําคัญที่สุดของแบบจําลองทางสถิติ โดยจาก ตัวอย่างเรื่องการคิดเบี้ยประกันรถยนต์ที่ให้ไปข้างต้น แบบจําลองทางสถิติ จะต้องมีการกําหนดสมมติฐานของ แต่ละตัวแปร ที่จะนํามาใช้ในการอนุมานความสัมพันธ์กับแนวโน้มในการเคลมประกันไว้อย่างชัดเจนตั้งแต่ต้นก่อนที่จะทําการเก็บข้อมูลและทดสอบแบบจําลองดังกล่าว
นอกจากนี้ อีกประเด็นหนึ่งคือ ความแตกต่างกันระหว่าง การพยากรณ์ ซึ่งเป็นการมองไปข้างหน้า (Forward looking) และการอธิบาย (Rearward looking) ความสัมพันธ์ระหว่างตัวแปร ซึ่งแน่นอนว่า Machine Learning ซึ่งมีการปรับแบบจําลองตามข้อมูลที่เข้ามาใหม่ตลอดเวลา เป็นการเน้นการมองไปข้างหน้า ในขณะ ที่แบบจําลองทางสถิติ เป็นการศึกษาข้อมูลและความสัมพันธ์ระหว่างตัวแปรในอดีต เพื่ออธิบายรูปแบบ ความสัมพันธ์ของข้อมูลในช่วงที่มีการเก็บรวบรวมซึ่งเป็นการเน้นการอธิบายสิ่งที่ได้เกิดขึ้น เช่น จากตัวอย่าง เดิมเรื่องการคิดเบี้ยประกันภัยรถยนต์ ที่แบบจําลองจาก Machine Learning จะมีการปรับปรุงและ เปลี่ยนแปลงอยู่ตลอดเวลาจากการเก็บข้อมูลเพิ่มเติมจากผู้ขับขี่รายใหม่ๆที่เข้าใช้งานระบบ ซึ่งต่างจาก การศึกษาทางสถิติที่จะสร้างแบบจําลองความสัมพันธ์ระหว่างพฤติกรรมการขับขี่กับการเคลมประกันจากกลุ่มตัวอย่างที่เก็บข้อมูลมาแล้วเป็นหลัก
ความแตกต่างอีกด้านคือความต้องการด้านข้อมูล ซึ่ง Machine Learning มักจะต้องใช้ข้อมูลจํานวนมากใน การศึกษา เพื่อให้ได้แบบจําลองที่สามารถทํางานและทําการพยากรณ์ได้ดี (ถึงแม้จะมีข้อยกเว้นในบางกรณี) เพราะการใช้ Machine Learning มีแนวโน้มที่จะเกิดการ Overfitting แบบจําลอง และข้อมูลจํานวนน้อย อาจจะมี Outliers คิดเป็นสัดส่วนที่มาก ส่งผลให้ความแม่นยําของแบบจําลองลดลง จึงมักจะต้องใช้กลุ่ม ตัวอย่างจํานวนหลักหมื่น จนถึงหลักล้าน การประยุกต์ใช้จึงเหมาะสําหรับอุตสาหกรรมที่มีการจัดเก็บข้อมูล จํานวนมากอยู่แล้ว เช่น ธนาคาร หรือข้อมูลที่เก็บได้จากอุปกรณ์ที่เก็บข้อมูลโดยอัตโนมัติ ซึ่งต่างจาก การ วิเคราะห์ทางสถิติโดยทั่วไปที่มักจะสามารถทําการอนุมาน และพยากรณ์ ได้ค่อนข้างดีโดยใช้ข้อมูลที่มีกลุ่ม ตัวอย่างหลักสิบ หรือหลักร้อย ดังเช่น การออกแบบสํารวจข้อมูลเพื่อศึกษาเรื่องใดเรื่องหนึ่งเป็นการเฉพาะ โดย ที่การเพิ่มจํานวนกลุ่มตัวอย่างไม่ได้ส่งผลมากนักต่อคุณภาพของแบบจําลอง เนื่องจากสมมติฐานต่างๆที่ถูกกําหนดมาในแบบจําลองทางสถิติจะถูกใช้เป็นข้อมูลที่สามารถนํามาเติมเต็มช่องว่างในการวิเคราะห์ดังกล่าวดังนั้น อาจกล่าวได้ว่าแบบจําลองทางสถิติทั่วไปจะได้เปรียบกว่า Machine Learning ในกรณีที่ไม่มีข้อมูลจํานวนมาก
ในทํานองเดียวกันกับจํานวนตัวอย่าง หรือข้อมูล ในกรณีที่จํานวนตัวแปรต้น (Predictor variables) มีจํานวน มาก ตัวแปรมีความสัมพันธ์กันเอง (Multicollinearity) และมีลักษณะความสัมพันธ์ที่ไม่เป็นสมการเชิงเส้น (Nonlinear) การใช้ Machine Learning อาจจะมีประสิทธิภาพมากกว่าแบบจําลองสถิติแบบดั้งเดิม ดังนั้น หากเราต้องการความแม่นยําในการพยากรณ์ข้อมูลต่างๆ และ มีกลุ่มตัวอย่าง หรือตัวแปรจํานวนมากใน แบบจําลอง การใช้ Machine Learning จะมีประสิทธิภาพที่สุด อย่างในการสร้างระบบ Image recognition และ Computer vision ซึ่งต้องใช้ข้อมูลรูปภาพในรูปแบบดิจิตัลจํานวนมากเพื่อให้คอมพิวเตอร์สามารถเรียนรู้ ได้ ในทางกลับกัน หากสิ่งที่เราต้องการคือการอธิบายความสัมพันธ์ระหว่างตัวแปร และจํานวนกลุ่มตัวอย่าง ค่อนข้างจํากัด การใช้แบบจําลองทางสถิติทั่วไปอาจมีความเหมาะสมมากกว่า
สุดท้ายนี้ ต้นทุนที่ลดลงอย่างต่อเนื่องของพลังประมวลผลของคอมพิวเตอร์ และความสามารถในการเก็บข้อมูล ปริมาณมหาศาล (Big data) จากทั้งราคาที่ลดลงของเทคโนโลยี การเชื่อมโยง IoT และ Platform คอมพิวเตอร์ แบบ On-demand ต่างๆ อย่าง AWS Cloud หรือ Google Cloud เปิดโอกาสให้การเข้าถึง Machine Learning เป็นไปได้ง่ายยิ่งขึ้น จากการประหยัดการลงทุนทั้งด้าน Hardware และ Software อย่างไรก็ตาม การ ประยุกต์ใช้เทคโนโลยีนี้ ยังต้องอาศัยการวางแผนระยะยาว โดยเฉพาะในด้านแนวทางการเก็บข้อมูล ความ เข้าใจในการทํางาน และข้อจํากัดของ Machine Learning รวมถึงความสัมพันธ์ระหว่างตัวแปร ซึ่งมีพื้นฐานมา จากวิชาสถิติ เพื่อให้เกิดประโยชน์สูงสุดในการนําไปใช้งาน