Academic Research in the 21st Century: Maintaining Scientific Integrityin a Climate of Perverse Incentives and Hypercompetition

Marc A. Edwards  and Siddhartha Roy (2016) ศึกษาปัญหาในการสร้างแรงจูงใจที่ผิดในวงการวิจัยทางวิทยาศาสตร์ที่นำไปสู่พฤติกรรมการทำผิดในการวิจัย และแนวทางในการปรับปรุงนโยบายในระดับสถาบันเพื่อสนับสนุนให้การทำวิจัยมีจริยธรรมมากขึ้น โดยในการศึกษามีวัตถุประสงค์เพื่อ

  1. เพื่ออธิบายว่าแรงจูงใจทางลบและการแข่งขันที่สูงได้เข้ามาเปลี่ยนพฤติกรรมของนักวิจัย มหาวิทยาลัย และลดความก้าวหน้าทางวิทยาศาสตร์ รวมทั้งเพิ่มการกระทำที่ขาดจริยธรรมอย่างไร
  2. เพื่อนำเสนอแบบจำลองที่จะช่วยอธิบายว่าการเน้นที่ปริมาณมากกว่าคุณภาพจะสร้างผลกระทบทางลบต่อความก้าวหน้าทางวิทยาศาสตร์ที่แท้จริงอย่างไร
  3. ศึกษาเกี่ยวกับการเปลี่ยนแปลงสภาพแวดล้อมในยุคต่อไปของนักวิจัยในสาขา  Science, Technology, Engineering and Mathematics (STEM) รวมทั้งการรับรู้ของสาธารณชน และอนาคตของวิทยาศาสตร์
  4. นำเสนอแนวทางที่คาดว่าจะช่วยสนับสนุนให้หน่วยงานด้านวิทยาศาสตร์มีประสิทธิผลเพิ่มขึ้น และยังคงได้รับความเชื่อถือจากสาธารณชน

ทั้งนี้ วิธีการศึกษาวิจัยจะดำเนินการทบทวนเอกสารต่างๆ ทั้งที่เป็นข้อเสนอแนะ ผลสำรวจ และงานวิจัยจากแหล่งต่างๆ  ซึ่งผลการศึกษาเบื้องต้นเกี่ยวกับภาพรวมของปัญหาพบว่า โครงสร้างแรงจูงใจและการให้รางวัลของวงการวิชาการมีการเปลี่ยนแปลงไปมากในช่วงครึ่งศตวรรษที่ผ่านมา การแข่งขันที่สูงขึ้นของบรรดาอาจารย์ที่จะก้าวไปสู่ตำแหน่งทางวิชาการ และนักศึกษาปริญญาเอกภายใต้สภาวะของตลาดแรงงานที่มีปริมาณอุปทานปัจจุบันของนักศึกษาปริญญาเอกมากเกินกว่าตำแหน่งที่มีอยู่ (Cyranoski et al., 2011; Stephan, 2012a; Aitkenhead, 2013; Ladner et al., 2013;Dzeng, 2014; Kolata, 2016) นอกจากนี้ ยังมีข้อกังวลอื่นๆ เกี่ยวกับความสนใจที่จะมาทำงานเป็นนักวิจัยของนักศึกษาปริญญาเอกในสถาบันที่เป็น  Tier-1 institutions ลดลงอย่างต่อเนื่อง เมื่อเทียบกับสาขาวิชาชีพอื่นๆ (Sauermann and Roach, 2012; Schneider et al., 2014) ส่วนหนึ่งเพราะการมุ่งเน้นการใช้เมทริกการประเมินเชิงปริมาณมากเกินไป การแข่งขันเพื่อขอทุนที่มีจำกัด การปรับโมเดลการบริหารจัดการของมหาวิทยาลัยไปสู่โมเดลเชิงธุรกิจมากขึ้น และความยากในการสร้างผลงานทางวิทยาศาสตร์ที่เป็นเสมือนสินค้าสาธารณะ

            จากการศึกษาแรงจูงใจทางลบที่ทำให้เกิดการทำผิดในการวิจัย ก็พบว่า เมื่อไม่นานมานี้ มีการนำระบบการประเมินที่เรียกว่า เมทริกการประเมินผลการดำเนินงานเชิงปริมาณ หรือ quantitative performance metrics (Van Noorden, 2010) มาปรับใช้ในการประเมินผลในวงการวิชาการ และมีการนำไปปรับใช้ในกระบวนการทำงานของมหาวิทยาลัยและภาคธุรกิจมากขึ้น (Plerou, et al., 1999; Brownlee, 2014; Kasperkevic, 2014) ซึ่งได้ทำให้เกิดการเปลี่ยนแปลงในวัฒนธรรมของสถาบันการศึกษาในทางลบ และสร้างปัญหาต่างๆ ให้เกิดขึ้นทั้งในระดับบุคคล และ ระดับหน่วยงาน แม้ว่าจะมีการคาดการณ์ผลที่เกิดขึ้นในเชิงบวก แต่สิ่งที่เกิดขึ้นจริงกลับเป็นไปในทิศทางที่แย่ลง เช่น  การให้รางวัลสำหรับนักวิจัยโดยพิจารณาจากจำนวนงานวิจัยที่ตีพิมพ์ ก็มีการคาดกันว่าจะส่งผลให้ผลิตภาพในการทำวิจัยจะเพิ่มขึ้น แต่ผลที่เกิดขึ้นจริงกลับเป็นไปในทางตรงกันข้าม เช่น การที่จำนวนสิ่งตีพิมพ์ที่ต่ำกว่ามาตรฐานมีปริมาณเพิ่มขึ้นมาก ในขณะที่งานวิจัยจำนวนมากกลับมีระเบียบวิธีวิจัยที่แย่ลง นำไปสู่ ‘‘natural selection of bad science’’ (Smaldino and Mcelreath, 2016) ที่ทำให้งานวิจัยคุณภาพต่ำเกลื่อนวงการวิชาการมากขึ้นและงานคุณภาพดีลดลงไป หรือในกรณีที่ มีการกำหนดเป้าหมายในการให้รางวัลอาจารย์ที่อิงกับผลการสอบของนักศึกษา ซึ่งคาดกันว่าจะทำให้ประสิทธิผลในการสอนเพิ่มขึ้น แต่ในความเป็นจริงกลับทำให้มีการสอนเพื่อที่จะสอบและเป็นการเรียนระยะสั้นๆ เพื่อเอาความรู้เฉพาะบางส่วนไปสอบเท่านั้น

ดังนั้น เมื่อเป้าหมายในการวัดผลิตภาพทางวิทยาศาสตร์ได้หันไปสู่การประเมินเชิงปริมาณมากขึ้น ไม่ว่าจะเป็นการนับจำนวนสิ่งตีพิมพ์ จำนวนการอ้างอิง การวัดด้วยดัชนีสิ่งตีพิมพ์ที่รวมการอ้างอิง (เช่น การวัดด้วย H-index หรือ ดัชนีที่แสดงถึงจำนวนผลงานวิจัย ที่มีจำนวนครั้งของการได้รับการอ้างอิงเท่ากับหรือมากกว่า จำนวนผลงานวิจัยนั้นๆ) การวัดผลด้วยดัชนีผลกระทบการอ้างอิงวารสาร (หรือหมายถึง จำนวนครั้งโดยเฉลี่ยที่บทความของวารสารนั้นจะได้รับการอ้างอิงในแต่ละปี หรือที่เรียกกันว่า journal impact factors (JIF)) การวัดด้วยจำนวนเงินที่ได้รับทุนวิจัย การวัดด้วยจำนวนสิทธิบัตร เป็นต้น ซึ่งการวัดผลเชิงปริมาณมีผลต่อการตัดสินใจของมหาวิทยาลัยในการจ้างงาน การให้รางวัล การเลื่อนขั้น การให้ตำแหน่งทางวิชาการ และการให้ทุน (Abbott et al., 2010; Carpenter et al., 2014) ก็ทำให้บุคลากรในสถาบันหันมาบริหารจัดการการประเมินให้เพื่อให้มีทิศทางไปในทางที่เขาจะได้ประโยชน์มากขึ้น เพราะรูปแบบการวัดผลเหล่านี้เป็นสิ่งที่สามารถจัดการได้ จึงทำให้เกิดการหลงผิดและทำให้มีการทำงานที่มีประสิทธิผลต่ำลง สอดคลองกับกฎของ Goodhart ที่ว่า “เมื่อการวัดผลถูกนำไปกำหนดเป็นเป้าหมาย มันก็จะไม่เป็นการวัดผลที่ดีอีกต่อไป” (Elton, 2004; Fischer et al., 2012; Werner, 2015) และสุดท้าย การวัดผลแบบนี้ก็จะทำให้เกิดความไม่เป็นธรรมและสร้างผลลัพธ์ที่แย่กว่าระบบการประเมินแบบเก่า และเอื้อต่อการทำให้เกิดการสร้างเครือข่ายที่ให้ประโยชน์ต่างตอบแทนกันขึ้นมา ซึ่งจากการสำรวจในปี 2010 พบว่า ร้อยละ 71 ของผู้ตอบกล่าวว่า พวกเขากลัวว่าเพื่อนร่วมงานในสถาบันเดียวกันเขาจะโกงเพื่อที่จะได้รับการประเมินที่ดีขึ้น  (Abbott, 2010)

นอกจากนี้ เมทริกการประเมินผลเชิงปริมาณเป็นการประเมินที่เน้น “ผลผลิต” ซึ่งอาจไม่ได้สอดคล้องกับผลลัพธ์ทางการวิจัยที่สามารถสร้างผลกระทบต่อสังคมในวงกว้าง โดยสถิติพบว่า ผลผลิตทางวิทยาศาสตร์ที่วัดโดย “การอ้างอิงผลงาน” ได้เพิ่มขึ้นสองเท่าในทุกๆ  9 ปี นับแต่สงครามโลกครั้งที่ 2 (Bornmann and Mutz, 2015) ทำให้เกิดภาระงานในการจัดการผลผลิตนี้ที่เพิ่มขึ้น การเขียนงานวิจัยที่สั้นลงและขาดการบูรณาการ  (Fischer et al., 2012) นอกจากนี้ ระบบการประเมินดังกล่าวยังทำให้มีการโกงในรูปแบบต่างๆ มากขึ้น เช่น  ล่าสุด มีการเปิดเผยโดยวารสารเกี่ยวกับพฤติกรรมของนักวิจัยว่ามีการโกงผลการทดสอบความมีนัยยะสำคัญทางสถิติ า ซ:7j’ซ(Falagas and Alexiou, 2008; Labbe´, 2010; Zhivotovsky andKrutovsky, 2008; Bartneck and Kokkelmans, 2011; Delgado Lo´pez-Co´zar et al., 2012; McDermott, 2013; Van Noorden, 2014; Barry, 2015) แต่ในขณะเดียวกัน อุตสาหกรรมการวิจัยกลับมีการเติบโตแบบเอ็กซ์โพเนนเชียล (Price, 1963; Frodeman, 2011) ซึ่งเป็นการเติบโตที่เกิดขึ้นถูกลวงตาจากผลของการจัดการเมทริกนั่นเอง

            ในการศึกษาแนวทางการสร้างความสมดุลในการประเมินด้านปริมาณและคุณภาพ ก็พบว่า ควรเน้นด้านปริมาณและคุณภาพในระดับที่เหมาะสม เพราะการเน้นหนักไปในบางเรื่องมากไปก็จะทำให้ประสิทธิภาพลดลง เช่น หากเป้าหมายของกิจการทางวิทยาศาสตร์คือเพื่อสร้างความก้าวหน้าให้วิทยาศาสตร์ที่แท้จริงให้สูงที่สุด ความก้าวหน้าที่ให้ความสำคัญกับด้านคุณภาพมากเกินไปก็อาจจะต้องการการวิจัยที่เป็น  blinded studies เพิ่มสามหรือสี่เท่า ซึ่งระบบดังกล่าวจะช่วยลดความผิดพลาดลงแต่อาจจะสร้างผลลัพธ์ที่ไม่มากนักเนื่องจากต้องเน้นความระมัดระวังที่มากเกินไป  ในขณะที่การให้ความสำคัญกับปริมาณมากเกินไปก็เกิดปัญหาขึ้นได้ เพราะความผิดพลาดที่เกิดขึ้นมากๆ จะสร้างต้นทุนตามมาทีหลัง และทำให้ความก้าวหน้าที่แท้จริงลดลงด้วย นอกจากนี้  ในระบบที่ให้ความสำคัญกับคุณภาพมากเกินไปจะมีแรงจูงใจน้อยลงที่จะหาทางทำงานที่ใช้ต้นทุนต่ำที่สุดเพราะระบบการตรวจสอบแบบถ่วงดุลที่เข้มงวดที่ทำให้มีการค้นพบปัญหาได้ง่าย ในขณะที่การเน้นปริมาณก็จะทำให้ผลิตภาพลดลงเนื่องจากข้อผิดพลาดที่เกิดขึ้นจำนวนมากจากการขาดความระมัดระวัง การทำผิดในการวิจัย และการทบทวนที่ไม่ได้มาตรฐาน  ดังนั้น ผลิตภาพที่เหมาะสมจึงอยู่ระหว่างความสุดโต่งทั้งด้านปริมาณและคุณภาพ ซึ่งเป็นไปได้ว่า การปฏิบัติที่เกิดขึ้นในปัจจุบันอาจจะเข้าใกล้จุดที่เหมาะสมมากขึ้น  อย่างไรก็ตาม ในระยะยาว ภายใต้ระบบของการสร้างแรงจูงใจที่ผิด เส้นโค้งผลิตภาพที่แท้จริงก็อาจจะเปลี่ยนแปลงได้เนื่องจากการเข้าไปจัดการในการประเมินผลงานและพฤติกรรมที่ขาดจริยธรรม ซึ่งจากภาพที่ 1 ก็จะเห็นว่า เส้นโค้งมีการเคลื่อนลง เมื่อคนเข้าไปจัดการกับระบบอย่างขาดจริยธรรม

อีกปัญหาที่เกิดขึ้นในวงการวิจัยก็คือ ปัญหาของการมุ่งเน้นผลผลิตมากกว่าผลลัพธ์ หรือปริมาณมากกว่าคุณภาพ ที่จะสร้างระบบที่เรียกว่า  ‘‘perversion of natural selection’’ ที่จะกำจัดนักวิจัยที่เห็นแก่ประโยชน์ส่วนรวมและมีจริยธรรมออกไป  ในขณะที่เอื้อต่อคนที่ปรับตัวตามกระแสของแรงจูงใจด้านลบให้อยู่รอด ในทำนองเดียวกัน ถ้านักวิจัยที่มีจริยธรรมเริ่มรู้สึกถึงความจำเป็นที่จะต้องอยู่ร่วมกับพฤติกรรมที่ไร้จริยธรรมเพื่อความก้าวหน้าในอาชีพการงานของตน พวกเขาก็จะกลายเป็นผู้ร่วมสมคบคิดตามแบบจำลอง Threshold Model of Collective Behavior (1978) ของ  Granovetter  เมื่อเป็นเช่นนี้ พฤติกรรมที่ไร้จริยธรรมก็จะฝังอยู่ในโครงสร้างและระบบของวัฒนธรรมวิชาชีพ (Ashforth and Anand, 2003) และก็จะทำให้นักวิชาการที่มีจริยธรรมและมีจิตสาธารณะมีเหตุผลเพียงพอที่จะออกจากสาขาวิชาชีพที่เขารัก และถูกแทนที่ด้วยคนที่ยอมรับสถานการณ์ที่ไร้จริยธรรมได้เข้ามามากขึ้น

เมื่อศึกษาถึงผลกระทบในระดับสถาบันก็พบว่า แรงจูงใจที่ผิดของสถาบันการศึกษาได้เติบโตและขยายตัวครอบคลุมมากขึ้นเรื่อยๆ และยังสร้างผลกระทบในวงกว้างขึ้น ตัวอย่างที่เห็นชัดเจน คือ การจัดอันดับสถาบันการศึกษายอดเยี่ยมของ U.S. News & World Report annual rankings (Morse, 2015) ที่ส่งผลกระทบทั้งในเชิงบวกและลบในวงกว้าง และสร้างการรับรู้ต่อสาธารณชนเกี่ยวกับคุณภาพของสถาบันการศึกษาที่อิงกับการจัดอันดับนั้น  (Casper, 1996; Gladwell, 2011; Tierney, 2013)  โดยการจัดอันดับนี้อยู่บนพื้นฐานของสูตรและอัลกอริทึม ซึ่งมหาวิทยาลัยที่ต้องการอันดับสูงๆ ก็อาจจะใช้กลวิธีในการกระจายทรัพยากรใหม่หรือการลงทุนในสาขาที่จะได้รับคะแนนประเมินในเมทริกสูงขึ้น ตัวอย่างของ  Northeastern University ที่ได้รับการจัดอันดับเพิ่มขึ้นจากอันดับที่ 162 ในปี 1996 ไปเป็นอันดับที่ 42 ในปี 2015 เกิดจากการเปลี่ยนแปลงขนาดชั้นเรียน อัตราการยอมรับ และการประเมินของ Peer และยังมีกรณีของมหาวิทยาลัยอื่นๆ ที่ใช้วิธีการปรับการรายงานค่าทางสถิติที่ไม่เหมาะสม เช่น Bucknell University, Claremont-McKenna College, Clemson University, George Washington University, and Emory University (Slotnik and Perez-Pena, 2012; Anderson, 2013; Kutner, 2014) ซึ่งจากการสำรวจของ Gallup and Inside Higher Ed poll ในปี 2013 พบว่า มากกว่าร้อยละ 90 ของเจ้าหน้าที่ที่ทำงานในวิทยาลัยเชื่อว่าสถาบันอื่นๆ ก็ส่งข้อมูลเท็จไปให้ สถาบันจัดอันดับเช่นกัน (Jaschik, 2013) สถานการณ์เช่นนี้ได้กดดันให้มีการโกงเกิดขึ้นทั้งระบบเพื่อที่จะรักษาอันดับของหน่วยงานไว้ จากการศึกษาปัญหาในหน่วยงานให้ทุนในสหรัฐก็พบว่า ในอดีตที่ผ่านมารัฐบาลกลางมีบทบาทสำคัญในการสนับสนุนทุนวิจัยและพัฒนา การสร้างองค์ความรู้ใหม่ การเติมเต็มพันธกิจด้านต่างๆ ไม่ว่าจะเป็นด้านการป้องกันประเทศ เกษตรกรรม โครงสร้างพื้นฐาน สิ่งแวดล้อม และสุขภาพ อย่างไรก็ตาม ในช่วงที่ผ่านมา จีนได้ถูกคาดว่าจะเป็นประเทศที่มีการใช้จ่ายด้านการวิจัยและพัฒนาที่สูงแซงหน้าสหรัฐภายในปี 2020 บางคนก็กังวลว่า สหรัฐจะมีโครงสร้างพื้นฐานด้านการวิจัยและพัฒนาที่อ่อนแอลง เพราะการลดลงของการใช้จ่ายด้านวิจัยและพัฒนาอย่างต่อเนื่องในช่วงทศวรรษที่ผ่านมา (Casassus, 2014; OECD, 2014; MIT, 2015; Porter, 2015) จากข้อมูลสถิติยังพบว่า  ค่า ‘‘Research Intensity’’ ของสหรัฐลดลงเหลือ ร้อยละ 0.78 ในปี  2014 เมื่อเทียบกับร้อยละ 2 ในช่วงทศวรรษที่ 1960

ช่วงปลายทศวรรษที่ 2000 สถาบันวิจัยและมหาวิทยาลัยได้ไปสู่การบริหารจัดการที่พึ่งพาเงินจากภายนอกมากขึ้น ด้วยความคาดหมายว่าทุนวิจัยที่เพิ่มขึ้นจะทำให้พวกเขานำไปใช้เพิ่มผลิตภาพในการวิจัยมากขึ้น จึงสามารถกู้ยืมเงินได้ง่ายขึ้น จนกระทั่งเกิดวิกฤตทางการเงินในปี 2007-2008 (Stephan, 2012a)  ที่มหาวิทยาลัยได้รับอนุญาตให้ชดเชยหนี้ที่เกิดจากความพยายามขยายการกู้ยืมที่สุดท้ายแล้วไม่เป็นไปตามที่คาดหวัง (ill-fated expansion efforts) จึงทำให้ต้นทุนค่าบริหารจัดการเพิ่มขึ้น และเงินที่เอาไปใช้ในการทำวิจัยจริงกลับลดลง ทั้งๆ ที่เงินอุดหนุนการวิจัยยังคงเท่าเดิม

ตัวเลขการลงทุนในการวิจัยของรัฐบาลกลางที่ลดลงยิ่งทำให้เกิดสถานการณ์การให้ทุนวิจัยที่ย่ำแย่ (จากการสร้างสถานการณ์จำลอง 50 ปี)  และทำให้มีการแข่งขันเพื่อขอทุนเพิ่มขึ้น และนักวิจัยที่ต้องการขอรับทุนก็เพิ่มขึ้นเช่นกัน  (Lee, 2007; Quake, 2009; Harris and Benincasa, 2014; Schneider et al., 2014; Stein, 2015) จากสถิติพบว่า อัตราการให้ทุนของ NIH ได้ลดลงจากร้อยละ 30.5 ไปสู่ร้อยละ 18 ในระหว่างปี 1997 และ 2004  ในขณะที่ อัตราการให้ทุนของ NSF ยังคงที่ไม่เปลี่ยนแปลงอยู่ในช่วงร้อยละ 23-25 ในช่วงทศวรรษที่ผ่านมา (NSF, 2016)

แต่เมื่อพิจารณาเทียบกับจุดคุ้มทุนก็พบว่า อัตราการให้ทุนเหล่านี้ยังคงอยู่เหนือจุดคุ้มทุนซึ่งอยู่ที่ร้อยละ 6 ซึ่งเป็นจุดที่ต้นทุนสุทธิของการเขียนข้อเสนอเท่ากับมูลค่าสุทธิจากการได้รับทุนจากผู้ให้ทุน (Cushman et al., 2015) จึงมีคนตั้งข้อสงสัยเกี่ยวกับสภาพแวดล้อมในการให้ทุนวิจัยว่ามันมีการแข่งขันที่มากเกินไปหรือไม่ และมีการให้ความสำคัญกับความสำเร็จในอดีตมากเกินไปในการประเมิน (Lawrence, 2009; Fang and Casadevall, 2016) นักวิจัยจึงต้องปรับความคิดของพวกเขาให้สอดคล้องกับแนวทางการให้ทุนและใช้เวลาครึ่งหนึ่งของเวลาที่มีในการระบุถึงวิธีการที่จะทำตามข้อกำหนด และหันเหความสนใจออกไปจากการค้นพบทางวิทยาศาสตร์ (NSB, 2014; Schneider et al., 2014; Belluz et al., 2016)

อีกความเสี่ยงหนึ่งที่เป็นระบบต่อจริยธรรมทางวิทยาศาสตร์คือความโลภของมนุษย์ ทั้งที่ในอดีตมันเป็นส่วนหนึ่งที่กระตุ้นให้เกิดความก้าวหน้า ซึ่งมีหลักฐานพบว่า การตีพิมพ์งานวิจัยมักเจอปัญหากับการขาดการนำไปต่อยอด การใช้วิธีทางสถิติที่ไม่ได้มาตรฐาน ความล้มเหลวในการป้องกันไม่ให้เกิดความเอนเอียง  (Fanelli, 2009; Aschwanden, 2015; Belluz and Hoffman, 2015; Nuzzo, 2015; Gobry, 2016; Wilson, 2016) ซึ่งสัญญาณเตือนของปัญหาที่เป็นระบบเกิดขึ้นในช่วงปี 1991 เมื่อผู้อำนวยการของ NSF ชื่อ  Walter E. Massey กล่าวว่า ขนาดที่ใหญ่ขึ้น ความซับซ้อนที่เพิ่มขึ้น และการแข่งขันที่เพิ่มขึ้นทำให้วิทยาศาสตร์และวิศวกรรมศาสตร์ตกอยู่ในภาวะที่อ่อนไหวต่อการทำผิด (The New York Times, 1991)  ซึ่งการทำผิดในการวิจัยนั้น ไม่ได้แค่จำกัดอยู่ที่นักวิจัยของสถาบันเท่านั้น แต่ยังรวมไปถึงหน่วยงานของรัฐบาลกลางที่ถูกแรงจูงใจเชิงลบและภาวะการแข่งขันที่สูงทำให้มีการทำผิดไปด้วย จึงเกิดปรากฏการณ์ใหม่ที่เรียกว่า “การทำผิดในการวิจัยทางวิทยาศาสตร์ระดับสถาบัน” หรือ  “Institutional scientific research misconduct” (Lewis, 2014; Edwards, 2016)

จากการศึกษาเกี่ยวกับต้นทุนของการทำผิดในการวิจัย ก็พบว่า ที่ผ่านมา มีนักเศรษฐศาสตร์เน้นย้ำถึงความแพร่หลายของงานวิจัยทางวิทยาศาสตร์สมัยใหม่ที่ไม่สามารถเอาไปต่อยอดได้และเป็นงานคุณภาพต่ำที่ได้สร้างต้นทุนทางการเงินที่สูงต่อสังคม ทำให้เกิดคำถามต่อมาว่า วิทยาศาสตร์สมัยใหม่ยังคงมีความน่าเชื่อถืออยู่อีกหรือ (The Economist, 2013)  แต่ก็ยังมีความหวังว่าปัญหาบางประการที่จะสามารถลดการทำผิดในการวิจัย โดยการสร้างแนวปฏิบัติ การเปิดเผยข้อมูล หรือการมี peer review หลังจากตีพิมพ์แล้ว การศึกษาแบบสหวิชา และความพยายามที่จะต่อยอดงานวิจัยที่เป็นงานที่สำคัญของสาขาวิชา สิ่งเหล่านี้อาจจะชดเชยได้บางส่วนกับอัตราความผิดพลาดที่สูงในวิทยาศาสตร์สมัยใหม่ที่เกิดจากแรงจูงใจส่วนบุคคลและแรงจูงใจด้านสถาบันที่ผิด 

            ทั้งนี้ ในการศึกษาเกี่ยวกับต้นทุนในการทำผิด จะครอบคลุมการทำผิดในการวิจัย ซึ่งThe National Science Foundation ได้นิยามว่า เป็นความตั้งใจที่จะแต่งข้อมูลขึ้นมาเอง การดัดแปลงข้อมูล รวมถึงการลักลอกผลงานวิจัย ไม่ว่าจะเป็นในขั้นของการเขียนข้อเสนอ การดำเนินการวิจัย การทบทวนวรรณกรรม การรายงานผลการวิจัย (Steneck, 2007; Fischer, 2011) ซึ่งจากการสำรวจการทำผิดเหล่านี้ในระดับชาติ  พบว่า ร้อยละของผู้ตอบที่ทำผิดในการวิจัยที่ถูกสอบสวนโดย the Department of Health and Human Services (includes NIH) และ NSF อยู่ที่ราวร้อยละ 20-33  (U.S. Department of Health and Human Services, 2013; Kroll, 2015, pers. comm.) และเมื่อพิจารณาต้นทุนที่เกิดขึ้นจากการทำผิดในการวิจัยก็พบว่า ในสหรัฐมีต้นทุนทางตรงของการทำผิดในการวิจัยในแต่ละชิ้นงานอยู่ที่ราว 525,000 เหรียญ และมากกว่า 110 ล้านเหรียญของความเสียหายที่เกิดขึ้นทุกปีเกิดในระดับสถาบัน (Michalek, et al., 2010) สำหรับงานวิจัย 291 เรื่องที่มีการกระทำผิดในการวิจัยในช่วง 1992-2012 คิดเป็นมูลค่า 58 ล้านเหรียญ ซึ่งเป็นงานวิจัยที่ได้รับการจัดสรรทุนจาก NIH การถูกถอดถอนออกจากการการตีพิมพ์สร้างต้นทุนทางตรงอยู่ที่ราวๆ 400,000 เหรียญต่องานวิจัย (Stern et al., 2014) นอกจากนี้ ยังมีเหตุการณ์ที่เป็นการทำผิดในการวิจัยที่ตรวจไม่พบอีกที่มากกว่ากรณีที่ตรวจพบราวสองเท่าในแต่ละปี ซึ่งเหตุการณ์ที่เกิดขึ้นจริงยังไม่แน่ชัดว่าจะมีมากน้อยแค่ไหนและไม่สามารถคาดการณ์ได้ นอกจากนี้ จากการศึกษาแบบบูรณาการสหวิชาเกี่ยวกับการทำผิดในการวิจัยก็พบว่า ในช่วงปี 1987-2008 มีนักวิทยาศาสตร์ 1 ใน 50 คนที่ยอมรับว่าตนทำผิดในการวิจัยครั้งหนึ่งเป็นอย่างน้อย  และร้อยละ 14 รู้ว่าเพื่อนร่วมงานคนใดที่ทำผิดเช่นกัน  (Fanelli, 2009) อย่างไรก็ดี จำนวนการทำผิดจากการสำรวจเหล่านี้ยังเป็นการประมาณการณ์ที่ต่ำจนเกินไปเมื่อพิจารณาจากประเด็นคำถามที่อ่อนไหว อัตราการตอบที่ต่ำ และยังมีปรากฏการณ์ที่เรียกว่า  Muhammad Ali effect (เป็นความเอนเอียงเพื่อเข้าข้างตัวเองว่าตัวเองมีความซื่อสัตย์กว่าคนอื่นๆ) (Allison et al., 1989) และเมื่อสอบถามเชิงลึกมากขึ้น ก็พบว่า เกือบร้อยละ 34 ของนักวิจัยมีการรายงานตนเองว่าพวกเขามีส่วนในการทำผิดในรูปของ ‘‘questionable research practices ไม่ว่าจะเป็นการตัดจุดข้อมูลในกราฟโดยใช้ลางสังหรณ์ของตัวเองในการตัดสินใจ การเปลี่ยนรูปแบบการวิจัย การเปลี่ยนระเบียบวิธีวิจัย และผลลัพธ์จากการศึกษาวิจัย เพื่อตอบสนองต่อแรงกดดันจากผู้ให้ทุน ซึ่งเกือบร้อยละ 72 ของผู้ที่ถูกสำรวจก็รู้ว่าเพื่อนร่วมงานคนไหนที่ทำแบบนั้นเช่นกัน (Fanelli, 2009) อีกงานวิจัยอันหนึ่งที่อยู่ในงานวิจัยแบบสหวิชาของ Fanelli ที่ได้สำรวจอัตราการเข้าไปเกี่ยวข้องกับการทำผิดในการวิจัยของนักศึกษาปริญญาเอก 2,000 คน คณะ 2,000 คณะ โดยคัดเลือกจากคณะต่างๆ 99 คณะ ได้แก่ เคมี วิศวกรรโยธา จุลชีววิทยา สังคมวิทยา พบว่า ร้อยละ 6-8 ของนักศึกษาและคณะทราบว่าคณะมีการปลอมแปลงข้อมูล (Swazey et al., 1993) และจากการสำรวจในสาขาการวิจัยด้านวิทยาศาสตร์และชีวการแพทย์ พบว่า  ร้อยละของงานวิจัยที่ถูกถอดถอนเพิ่มขึ้นสี่เท่านับแต่ปี 1975 โดยมีร้อยละ 67 ที่ถูกถอดถอนเพราะการทำผิดในการวิจัย (Fang et al., 2012)  ทำให้มีการตั้งสมมติฐานเกี่ยวกับสิ่งที่ทำให้การทำผิดเหล่านี้เพิ่มขึ้น ไม่ว่าจะเป็น การตกหลุมพลางของการตีพิมพ์ในวารสารชั้นเยี่ยม วัฒนธรรมของสถานศึกษา ช่วงอายุของหน้าที่การงาน และแรงจูงใจทางลบ (Martinson et al., 2009; Harding et al., 2012; Laduke, 2013; Schekman, 2013; Buela-Casal, 2014; Fanelli et al., 2015; Marcus and Oransky, 2015; Sarewitz, 2016)

            จากการศึกษายังพบว่า ปัญหาการทำผิดในการวิจัยอาจสร้างความเสียหายหนักขึ้นถ้ามันสร้างพฤติกรรมฝังลึกเข้าไปในโครงสร้างวัฒนธรรมขององค์กร และปัญหาดังกล่าวก็ยากแก่การแก้ไข เพราะมีแรงจูงใจที่สร้างขึ้นทั่วทั้งระบบที่กระตุ้นให้ผู้ที่เข้ามามีส่วนได้ส่วนเสียแสร้งทำเป็นว่าไม่มีการทำผิดเกิดขึ้น ด้วยเหตุนี้ นักวิทยาศาสตร์จึงไม่มีการพัฒนาระบบที่ชัดเจนโปร่งใสในการรายงาน สอบสวน หรือจัดการกับข้อกล่าวหา และใครก็ตามที่พยายามจะแก้ไขพฤติกรรมดังกล่าวก็มักจะพบกับความคับข้องใจและต้องถูกแรงสะท้อนกลับทางลบจากคนในวงการเดียวกัน  (Macilwain, 1997; Kevles, 2000; Denworth, 2008) จนกระทั่งทำให้ มีการขนานนามกิจการวิจัยของสถาบันสมัยใหม่ว่า‘‘Ponzi Scheme’’  หรือ การแชร์ลูกโซ่ โดย The Economist ซึ่งหากไม่มีการแก้ไขใดๆให้ทันท่วงทีก็อาจจะทำให้วงการวิทยาศาสตร์เสี่ยงต่อการเกิดวัฒนธรรมที่เห็นการคอร์รัปชั่นเป็นเรื่องปกติ  (Ashforth and Anand, 2003) เหมือนกับกรณีข้อกล่าวหาเรื่องการโกงของ  the Atlanta school ที่  Lance Armstrong ชนะการแข่งขัน the Tour de France ตลอดเวลา 7 ปี (1999–2005) เพราะการโดปยาก่อนการแข่งขัน ซึ่งคนอื่นๆในทีมก็โกงเช่นกัน เนื่องจากการมีวัฒนธรรมของการที่จะเอาชนะโดยไม่สนใจว่าจะทำถูกหรือผิดกฎ  (U.S. ADA, 2012; Rose and Fisher, 2013; Saraceno, 2013)   ในทำนองเดียวกัน ก็มีตัวอย่างอื่นๆ จาก  Atlanta Public Schools (APS) ที่มีการสร้างแรงจูงใจที่ผิดจนทำให้การคอร์รัปชั่นเกิดขึ้นจำนวนมาก โดยอดีตพนักงานของ APS 12 คนถูกตัดสินจำคุก เนื่องจากการทำผิดจริยธรรมโดยการดัดแปลงข้อมูลผลการศึกษาของนักเรียน เพราะแรงจูงใจที่ผิดที่สถาบันสร้างขึ้น เนื่องจากถ้าผลการทดสอบดังกล่าวออกมาดีจะส่งผลเชิงบวกต่อทั้งนักเรียนและตัวพนักงานเอง โดยนักเรียนก็จะมีเกรดสูงขึ้น สถาบันการศึกษาก็จะได้รับทรัพยากรอุดหนุนมากขึ้น พนักงานก็จะได้โบนัสเพิ่ม (Kamenetz, 2015)

            จากการศึกษาดังกล่าว พบว่า น่าจะถึงเวลาที่ต้องมีการจัดการกับปัญหาดังกล่าวอย่างจริงจังเพื่อสร้างความเป็นมืออาชีพให้แก่สถาบันการศึกษาในยุคต่อไป  ซึ่งสิ่งที่ควรจะพิจารณาปรับปรุงในระยะต่อไปได้แก่

  1. ควรทำความเข้าใจขอบเขตปัญหาอย่างถ่องแท้ โดยการใช้ความรู้และประสบการณ์ของคนในวงการ STEM ตลอดจนการสำรวจอย่างครอบคลุมทั้งจากนักวิจัยและนักศึกษา
  2. The National Science Foundation ควรแต่งตั้งคณะทำงานที่ประกอบด้วยนักเศรษฐศาสตร์ และนักสังคมศาสตร์ที่มีความเชี่ยวชาญในการศึกษาด้านแรงจูงใจเชิงลบที่มีต่อพฤติกรรม เพื่อรวบรวมและทบทวนปัจจัยนำเข้าที่สำคัญในทุกๆ ระดับของสถาบันการศึกษา โดยคณะกรรมการดังกล่าวจะมีหน้าที่พัฒนา “บัญชีว่าด้วยแนวปฏิบัติที่ดี” เพื่อเป็นแนวทางในการประเมินคนที่จะเข้ามาทำงานและเพื่อสนับสนุนความก้าวหน้าให้แก่ผู้ที่ปฏิบัติดี
  3. แทนที่จะแสร้งทำไม่เห็นปัญหาของการทำผิดในการวิจัย นักศึกษาด้านวิทยาศาสตร์และวิศวกรรมศาสตร์ทั้งระดับปริญญาตรีและบัณฑิตศึกษาควรได้รับการสร้างความตระหนักรู้เกี่ยวกับสถานการณ์บนโลกแห่งความเป็นจริง แรงจูงใจ และความตึงเครียดต่างๆ ที่มีส่วนในการสร้างโอกาสในการเกิดพฤติกรรการทำผิดในการวิจัยมากขึ้น
  4. นอกเหนือจากเป้าหมายของการบรรลุผลเชิงปริมาณที่ทำกันเป็นแบบแผนแล้ว นักศึกษาปริญญาเอกควรที่จะเป็นเสมือนผู้ฝึกหัดที่จะสร้างบทบาทใหม่ที่จะทำให้มีการประยุกต์ใช้วิทยาศาสตร์เพื่อประโยชน์ต่อมนุษยชาติมากขึ้น (Huber, 2014)
  5. มหาวิทยาลัยจำเป็นต้องลดแรงจูงใจทางลบและสนับสนุนนโยบายที่ช่วยลดพฤติกรรมการทำผิดในการวิจัยและกระตุ้นให้บุคลากรมีจริยธรรมมากขึ้น   

Facebook Comments

Share with: