ความร่วมมือของนักฟิสิกส์และนักวิทยาศาสตร์คอมพิวเตอร์ได้แสดงให้เห็นว่าปัญญาประดิษฐ์ (AI) สามารถช่วยควบคุมกระบวนการที่ละเอียดอ่อนในการจำกัดพลาสมาที่ร้อนจัดภายในเครื่องปฏิกรณ์ฟิวชันได้ สมาชิกในทีมกล่าวว่าการสาธิตของพวกเขาซึ่งใช้ประโยชน์จากเทคนิคที่เรียกว่าการเรียนรู้การเสริมกำลังเพื่อใช้งานขดลวดแม่เหล็กใน tokamak จะช่วยให้สามารถพัฒนาเครื่องปฏิกรณ์
ได้อย่างรวดเร็ว
ยิ่งขึ้นด้วยรูปทรงเรขาคณิตแบบใหม่เป็นห้องรูปทรงโดนัทที่ออกแบบมาเพื่อผลิตพลังงานโดยการหลอมรวมนิวเคลียสของแสงในรูปของพลาสมา นิวเคลียสถูกทำให้ร้อนถึงหลายร้อยล้านองศาเพื่อเอาชนะแรงผลักซึ่งกันและกัน ในขณะที่พลาสมาถูกตรึงอยู่กับที่โดยใช้สนามจากชุดของขดลวดแม่เหล็ก
สนามเหล่านั้นจะกันพลาสมาออกจากผนังห้อง ซึ่งมิฉะนั้นจะสูญเสียความร้อนและทำให้โทคาแมคเสียหายจุดมุ่งหมายประการหนึ่งของนักวิทยาศาสตร์ด้านฟิวชันคือการเข้าใจว่าการกระจายเชิงพื้นที่ของพลาสมาภายในห้อง tokamak มีอิทธิพลต่อความเสถียรและการกักขังเชิงพื้นที่อย่างไร งานนี้
มีความซับซ้อนเนื่องจากจำเป็นต้องออกแบบโครงร่างข้อเสนอแนะใหม่สำหรับการกำหนดค่าแต่ละรายการ เพื่อให้สามารถปรับแม่เหล็กได้อย่างเหมาะสมเพื่อตอบสนองต่อพฤติกรรมที่ไม่เชิงเส้นสูงของพลาสมา กระบวนการออกแบบมักจะเกี่ยวข้องกับการคำนวณชุดเริ่มต้นของกระแสขดลวด
และแรงดัน จากนั้นจึงใช้อัลกอริทึมการสร้างพลาสมาใหม่และตัวควบคุมป้อนกลับรวมกันเพื่อปรับแรงดันไฟฟ้า และร่วมกับสนามแม่เหล็ก ผลลัพธ์คือการควบคุมตำแหน่งแนวตั้งและแนวรัศมีของพลาสมาอย่างมีประสิทธิภาพ ตลอดจนกระแสของมัน แต่ต้องใช้ความพยายามอย่างมากเท่านั้น
รางวัลที่เหมาะสมในงานล่าสุด นักวิทยาศาสตร์จากบริษัท ในสวิตเซอร์แลนด์ได้เปลี่ยนตัวควบคุมป้อนกลับหลายตัวเหล่านี้เป็นตัวควบคุมตัวเดียวโดยอิงตามการเรียนรู้แบบเสริมแรง (RL) อัลกอริทึม RL เป็นรูปแบบหนึ่งของการเรียนรู้ของเครื่องที่ได้รับการออกแบบเพื่อให้ได้ชุดค่าเอาต์พุตที่เหมาะสม
โดยการปรับ
น้ำหนักบนโหนดในลักษณะที่เป็นขั้นตอนในกรณีนี้ อัลกอริทึม “ตัวแทน” ได้รับค่าที่วัดได้และค่าเป้าหมายของพารามิเตอร์พลาสมา ซึ่งเป็นรายการขนาดยาว รวมถึงมิติเชิงพื้นที่จำนวนมาก กระแสไฟฟ้า และฟลักซ์แม่เหล็กภายในห้องโทคาแมค เป็นอินพุต หลังจากประมวลผลค่าเหล่านี้โดยใช้โหนด
หลายชั้นแล้ว จะส่งเอาต์พุตที่สอดคล้องกับระดับแรงดันไฟฟ้าบนแม่เหล็กแต่ละอัน เมื่อแม่เหล็กได้รับการปรับและได้รับข้อเสนอแนะใหม่จากเซ็นเซอร์ วงจรจะเริ่มขึ้นอีกครั้ง โดยทำซ้ำประมาณ 10,000 ครั้งต่อวินาทีกระบวนการนี้อาศัยวัตถุการคำนวณที่เรียกว่าฟังก์ชันการให้รางวัล ซึ่งจะเปรียบเทียบค่า
ที่วัดได้และค่าเป้าหมายของพารามิเตอร์พลาสมาในแต่ละขั้นตอน และรวมความแตกต่างระหว่างพารามิเตอร์ทั้งหมดเป็นค่าเดียว ค่านี้เป็นตัวกำหนดว่าตัวแทนจะได้รับ “รางวัล” มากเพียงใดเมื่อเข้าใกล้ค่าที่ต้องการมากขึ้น ในทางกลับกัน หากพลาสมาชนกับผนังห้อง เจ้าหน้าที่จะได้รับการลงโทษ
และกระบวนการจะหยุดลงการทำงานกับฟังก์ชันการให้รางวัลนี้เป็นขั้นตอนแรกของการตั้งค่าตัวควบคุมที่ใช้ RL ใหม่ เนื่องจากแต่ละฟังก์ชันสอดคล้องกับการกำหนดค่าพลาสมาเฉพาะ ต่อไป เอเจนต์จะได้รับการฝึกโดยเปิดเผยข้อมูลอินพุตจากโทคามักจำลอง ซึ่งต้องอธิบายรูปร่างและกระแสที่เปลี่ยนแปลง
ของพลาสมาได้อย่างสมจริง ในขณะที่จำกัดความต้องการในการคำนวณเพื่อให้กระบวนการเรียนรู้สั้น สุดท้าย แผนการควบคุมที่เพิ่มประสิทธิภาพของเอเจนต์ได้รับการทดสอบบนโทคาแมคจริงการทดสอบ AIในการดำเนินการขั้นทดลองของงาน การทำงานร่วมกันได้หันไปใช้ แบบกำหนดค่าตัวแปรของ EPFL
ในขั้นต้น
สมาชิกของทีมใช้ตัวควบคุมป้อนกลับแบบดั้งเดิมเพื่อสร้างและบำรุงรักษาพลาสมาในสถานะเริ่มต้น เมื่อถึงเวลาที่ตกลงกันไว้ล่วงหน้า พวกเขาเปลี่ยนไปใช้รูปแบบการควบคุมของตนเอง โดยปรับขดลวดแม่เหล็ก 19 ชุดที่แยกจากกันเพื่อปรับแต่งพลาสมาเพื่อให้ได้รูปร่างและกระแสที่ถูกต้องในขณะที่รักษา
น้ำหนักของโครงข่ายประสาทเทียมจากนั้น นักวิจัยได้แสดงให้เห็นว่าพวกเขาสามารถควบคุมกระแสและรูปร่างของพลาสมาได้โดยมีค่าเบี่ยงเบนไม่เกินสองสามเปอร์เซ็นต์จากค่าที่ตั้งใจไว้ ในขณะที่ทำการเปลี่ยนแปลงที่จำเป็นสำหรับการปลดปล่อยพลาสมาทั้งหมด พวกเขายังสามารถจัดการพลาสมา
ให้เป็นรูปร่างต่างๆ ได้ ซึ่งรวมถึงรูปร่างที่คล้ายกับที่เสนอสำหรับเครื่องปฏิกรณ์ ITERที่สร้างขึ้นทางตอนใต้ของฝรั่งเศส และอีกรูปแบบหนึ่งที่เรียกว่าโครงร่างเกล็ดหิมะที่ช่วยกระจายความร้อนและไอเสียของอนุภาคโทคามัคไปทั่ว พื้นผิวที่ใหญ่ขึ้น นอกจากนี้ พวกเขายังแสดงให้เห็นว่าเป็นไปได้
ที่จะสร้างพลาสมาสองแห่งแยกกันภายในโทคาแมคเดียวกัน ซึ่งพวกเขากล่าวว่าเป็นขั้นตอนแรกในการศึกษาการกำหนดค่าพลาสมาขั้นสูงเพิ่มเติมการปรับปรุงประสิทธิภาพนักวิจัยกล่าวว่าโครงร่างที่ใช้ AI แบบใหม่ของพวกเขาสามารถปรับปรุงประสิทธิภาพของ tokamak ได้ โดยธรรมชาติแบบปลายเปิด
ตั้งข้อสังเกตว่ายังคงต้องดูว่าวิธีการใหม่นี้สามารถนำไปใช้ได้ดีเพียงใดโดยใช้ตัวนำยิ่งยวดมากกว่าขดลวดทองแดง เนื่องจากวิธีเดิมแนะนำการหน่วงเวลาเมื่อควบคุมกระแส เขาเสริมความไม่แน่นอนอีกประการหนึ่งคือการควบคุมเสถียรภาพ ในขณะที่อัลกอริธึม RL เปิดใช้งานการดำเนินการในสถานะคงที่
เขาตั้งข้อสังเกตว่า “โทคามัคมีเหตุการณ์ที่ไม่เสถียรที่สำคัญอื่นๆ ที่ต้องควบคุม”อาจทำให้กำลังขับสูงสุดได้ กล่าวโดยกว้างกว่านั้น เทคโนโลยีนี้อาจนำไปสู่การออกแบบเครื่องปฏิกรณ์ใหม่โดยอนุญาตให้มีการเพิ่มประสิทธิภาพร่วมกันของพารามิเตอร์อุปกรณ์หลายอย่าง รวมถึงรูปทรงพลาสมา การออกแบบผนัง และภาระความร้อน
แนะนำ 666slotclub / hob66