ปลดล็อกองค์ประกอบเสียง: คู่มือการแยกเสียงร้องและดนตรีด้วย Python และ Demucs (ฉบับ Windows)

ความเร็ว: 1.0x

เลือกเสียง:

ปรับขนาดตัวอักษร

^-A A ⁺A

blind IT And blind programmers

สวัสดีครับ ก็กลับมาพบกับผม ป๊อกซ่าไอที กันอีกครั้ง! สำหรับครั้งนี้ก็มีเรื่องราวสุดพิเศษที่อดใจไม่ไหวรีบอยากมาแบ่งปันท่านผู้อ่าน นั่นก็คือการแยกเสียงร้องกับเสียงดนตรีออกจากกัน ซึ่งเป็นทริคที่ผมว่ามีประโยชน์มาก ๆ โดยเฉพาะกับเพื่อน ๆ ที่ชอบทำ ไฟล์คาราโอเกะ หรือต้องการดนตรีบรรเลงไปใช้ในงานต่าง ๆ

เมื่อก่อนเราอาจจะใช้โปรแกรมติดตั้งบนคอมพิวเตอร์อย่าง Ultimate Vocal Remover หรือบริการออนไลน์อย่าง Moises ซึ่งก็มีข้อดีข้อด้อยต่างกันไป แต่เดี๋ยวนี้ AI เกิดขึ้นเยอะแยะมากมาย และเจ๋งกว่านั้นคือเราสามารถนำ AI เหล่านี้มาติดตั้งใช้งานบนคอมพิวเตอร์ส่วนตัวของเราได้ง่าย ๆ ผ่าน Python ใช้พื้นที่น้อย แถมไม่กินสเปคคอมพิวเตอร์มากเกินไป

วันนี้ผมเลยจะมาพาไปดูว่าขั้นตอนการติดตั้งใช้งานเป็นยังไง ไปรับชมกันเลย!

Demucs – ขุมพลัง AI แห่งการแยกเสียง

เครื่องมือที่เราจะมาลองใช้กันวันนี้คือ Demucs ครับ เจ้านี่เป็นโมเดลที่พัฒนาโดย Facebook AI Research (FAIR) และบอกเลยว่ามันเจ๋งจริง ๆ ในด้านความแม่นยำในการแยกเสียง โดยเฉพาะโมเดล htdemucs_ft (Hybrid Transformer Demucs, Fine-Tuned) ที่กลุ่มผู้ใช้ยอมรับว่าให้ผลลัพธ์ดีที่สุด แม้ว่าอาจจะใช้เวลาประมวลผลนานกว่าโมเดลอื่น ๆ บ้างก็ตาม แหะ ๆ แต่ก็คุ้มค่าแน่นอน!

Demucs นั้นทำงานบน Python ข้อดีคือเราสามารถใช้งานแบบ Offline ได้อย่างสบาย ๆ บน Windows ทำให้เราประมวลผลไฟล์เพลงได้เยอะ ๆ อย่างรวดเร็วและเป็นส่วนตัวสุด ๆ ไม่ต้องห่วงเรื่องการอัปโหลดไฟล์ไปไหนเลย ซึ่งขั้นตอนการติดตั้งและใช้งานก็ไม่ซับซ้อนอย่างที่คิดครับ แค่ใช้ Command Prompt (CMD) หรือ PowerShell บน Windows เพียงไม่กี่คำสั่งเท่านั้น!

ขั้นตอนที่ 1: ติดตั้ง Python และเตรียมเครื่องมือบน Windows

ก่อนอื่น สิ่งแรกที่เราต้องมีคือโปรแกรม Python ครับ (แนะนำเวอร์ชัน 3.8 ขึ้นไป) ตอนติดตั้ง อย่าลืมติ๊กช่อง "Add Python to PATH" ด้วยนะครับ ไม่งั้นจะเรียกใช้คำสั่ง pip ไม่ได้ เสร็จแล้วก็เปิด Command Prompt หรือ PowerShell ขึ้นมา แล้วมาลุยติดตั้งแพ็คเกจที่จำเป็นกันเลยครับ

ติดตั้ง Demucs ซึ่งเป็นหัวใจหลักของงานนี้
- pip install demucs
ติดตั้งแพ็คเกจเสริม สำหรับจัดการไฟล์เสียง รองรับไฟล์ MP3/WAV และการเข้ารหัสต่าง ๆ อย่างมีประสิทธิภาพ:
- pip install soundfile lameenc scipy

พอรันคำสั่งเหล่านี้เสร็จเรียบร้อย ก็ถือว่าคอมพิวเตอร์ Windows ของเราพร้อมแล้วสำหรับการแยกเสียงด้วยพลัง AI สุดเจ๋ง!

ขั้นตอนที่ 2: คำสั่งลุยงาน: แยกเสียงร้องด้วย 2 และ 4 องค์ประกอบ

เมื่อติดตั้งเสร็จแล้ว ให้เพื่อน ๆ ย้ายไฟล์เพลงที่อยากแยกไปไว้ในโฟลเดอร์เดียวกันกับที่เราจะเปิด Command Prompt หรือใช้คำสั่ง cd เพื่อย้ายไปที่โฟลเดอร์นั้นก่อน (เช่น สมมติว่าไฟล์เพลงอยู่ในโฟลเดอร์ C:\Music ก็พิมพ์ cd C:\Music ก่อน) จากนั้นก็ใช้คำสั่ง Demucs ได้เลยครับ เลือกได้ตามความต้องการเลยว่าจะแยกแบบไหน

แยกแบบ 2 องค์ประกอบ (2 Stems: Vocals & Instrumental) เหมาะสุด ๆ สำหรับทำคาราโอเกะ หรือคนที่ต้องการดนตรีบรรเลงเฉย ๆ
- demucs -n htdemucs_ft --two-stems=vocals "ชื่อไฟล์เพลงของคุณ.mp3"
แยกแบบ 4 องค์ประกอบ (4 Stems: Vocals, Drums, Bass, Other) เหมาะสำหรับนักดนตรีหรือคนที่อยากรู้ว่าเครื่องดนตรีแต่ละชิ้นเล่นยังไงบ้าง
- demucs -n htdemucs_ft "ชื่อไฟล์เพลงของคุณ.mp3"

เดี๋ยวครับเดี๋ยว ป๊อกซ่าไอทีขอเน้น: อย่าลืม! ต้องใส่เครื่องหมายคำพูดคู่ (" ") ครอบชื่อไฟล์เพลง เสมอ ถ้าชื่อไฟล์นั้นมีเว้นวรรคหรือเป็นภาษาไทย ไม่งั้นเดี๋ยวจะรันไม่ผ่านนะครับ พอคำสั่งทำงานเสร็จแล้ว ไฟล์เสียงที่แยกออกมาก็จะถูกบันทึกไว้ในโฟลเดอร์ใหม่ชื่อเดียวกับโมเดล (เช่น htdemucs_ft) ภายในโฟลเดอร์เพลงต้นฉบับของเรานั่นเองครับ

ทางเลือกใหม่ที่คุ้มค่า

เป็นยังไงกันบ้างครับ ไม่ยากเลยใช่ไหม? แม้ว่าการศึกษาทำความคุ้นเคยกับ Command Line อาจต้องใช้เวลาสักหน่อย แต่ผมก็เชื่อว่าเพื่อน ๆ ทุกคนจะสามารถทำตามกันได้อย่างแน่นอน การใช้ Demucs ผ่าน Python ถือเป็นอีกทางเลือกที่คุ้มค่ามาก เพราะเราไม่ต้องจ่ายค่าบริการรายปี ไม่ต้องกังวลเรื่องพื้นที่จัดเก็บ และยังได้เห็นศักยภาพที่น่าทึ่งของ AI ในยุคปัจจุบันอีกด้วย หากมีข้อสงสัยหรือข้อคำถามตรงไหน ก็สามารถทิ้งคำถามไว้ได้เลย ผม ป๊อกซ่าไอที จะมาตอบทุกข้อสงสัยของท่าน สำหรับวันนี้ก็ลากันไปก่อนค๊าบบบ!

เขียน โดย ป๊อกซ่าไอที และ AI Gemini

ผู้อ่านสามารถสนับสนุนเว็บไซต์ โดยการอุดหนุนนิยายบนเว็บไซต์ เขียนกันดอทคอม เว็บไซต์อ่านนิยายที่คนตาบอดเป็นเจ้าของ และอยากให้สังคมการอ่านเป็นของคนทุกกลุ่ม ไม่ว่าตาดีหรือตาบอด

Tags:

บล็อกของ yod007

แสดงความคิดเห็น

ชนะพงษ์ บุญมี

จบครูจากมหาวิทยาลัยราชภัฏเชียงใหม่ มาได้งานไอทีที่นครราชสีมา ชื่นชอบเทคโนโลยีและจิบเบากับมิตรสหายในยามว่าง อินโทรเวิร์ตบ้างในบางคราว ชอบให้คนอื่นเรียกหนุ่มไอทีหรือช่างป๊อกไอที

ดูโปรไฟล์

บทความยอดนิยม

บรรยายสิ่งต่างๆ ให้คนตาบอดเข้าใจได้ไม่ยาก ขอแค่คิดว่าเล่าเรื่องให้เพื่อนฟัง

คนมองเห็นหลายคนมักไม่แน่ใจว่าถ้าต้องอธิบายภาพ หรืออธิบายอะไรสักอย่างให้คนตาบอดฟังแล้วเข้าใจควรบอกอย่างไร หลายครั้งเกรงว่าถ้าพูดไปแล้วคนตาบอดจะเข้าใจไหม จะนึกภาพออกหรือเปล่า...

ภาพวาดเด็กผู้หญิงคนหนึ่ง ผมสีน้ำตาลยาวถูกมัดเป็นหางม้า เธอกำลังยิ้มและยื่นแขนออกไปข้างหน้า สวมเสื้อสีฟ้าและสายเอี๊ยมสีน้ำตาล ข้างหลังเป็นทุ่งหญ้าสีเขียวและเส้นทางโค้งสีน้ำตาลอ่อน ด้านขวาบนของภาพมีข้อความที่เขียนว่า "STORIES OF BLOSSOM"

Stories of Blossom: ไม่ใช่แค่สนุกและคลายเครียด แต่คือเกมที่ออกแบบมาสำหรับการเข้าถึงของคนทุกกลุ่ม

“Accessibility for All” ประโยคนี้ ถ้าพูดกันในประเทศไทยเรา หรือในวงวิชาการ คนมักจะนึกถึงการเดินทาง การก่อสร้างอาคาร หรืออะไรที่มันจะเป็น Mega Project ที่ต้องลงทุนเยอะ ผลที่ได้ต้องคุ้มค่า...

วิธีการติดตั้งและใช้งาน WinCam1.6 โปรแกรมบันทึกวิดีโอบนคอมพิวเตอร์

หลักๆแล้ว การทำงานของโปรแกรมนี้สามารถสรุปเป็นคอนเซ็ปต์ได้คือ โปรแกรมนี้เป็นโปรแกรมอัดหน้าจอ ที่จะบันทึกภาพ เสียง สื่อ ในลักษณะของ Video อาทิเมื่อเรากดอัดวีดีโอ...

การแชร์ข่าวด้วยภาพที่มีข้อความ แล้วแชร์ลงไปในกลุ่มแจ้งข่าวหรือเพจแจ้งข่าวต่างๆ สิ่งที่เพิ่มความลำบากให้กับคนตาบอด อย่างที่คุณเองก็ไม่ตั้งใจ!

สำหรับสายท่องเว็บโซเชียลทั้งหลาย คิดว่าการที่เราได้รับรู้ข่าวสารต่างๆ คงมาจากเพจ หรือกลุ่มตามเว็บโซเชียลนั้นๆ ที่เราเข้าไปเล่นกันเป็นประจำ ไม่ว่าจะเป็น Facebook Line Twitter ฯลฯ...

เบื่อเสียง text to speech ในเครื่องแล้วหรือยัง มาประยุกต์ใช้ Microsoft Edge เพื่ออ่านข้อความให้ฟังกันดีกว่า

มาถึงวันนี้ ท่านผู้อ่านคงคุ้นเคยกันดี กับเสียงอ่านข้อความเป็นตัวอักษรของบริษัท Microsoft ซึ่งแพร่กระจายหลากหลายตามสื่อ Social Media ต่าง ๆ บางครั้ง ฟังเสียงตาทิพย์ ฟังเสียง Nuance Vocalizer...

“เครื่อง ศรีบัวพันธุ์” บุคคลสำคัญแห่งการนวดคนตาบอดไทย และวงการณ์คนตาบอดไทย

“ ฟ้ามีตา ฟ้ามีตาจริงๆ...” ในช่วงเวลาสั้นๆ 4-5 นาทีที่ชายชราตาบอดคนนี้พูดถึงความรู้สึกที่เขาได้รับการประกาศเกียรติคุณให้เป็นบุคคลเกียรติยศมูลนิธิโกมลคีมทอง เขาพูดประโยคหนึ่งถึงสองครั้ง “ฟ้ามีตา...

คุณอยู่ที่

ปลดล็อกองค์ประกอบเสียง: คู่มือการแยกเสียงร้องและดนตรีด้วย Python และ Demucs (ฉบับ Windows)

ปรับขนาดตัวอักษร

Demucs – ขุมพลัง AI แห่งการแยกเสียง

ขั้นตอนที่ 1: ติดตั้ง Python และเตรียมเครื่องมือบน Windows

ขั้นตอนที่ 2: คำสั่งลุยงาน: แยกเสียงร้องด้วย 2 และ 4 องค์ประกอบ

ทางเลือกใหม่ที่คุ้มค่า

Tags:

แสดงความคิดเห็น

ชนะพงษ์ บุญมี

บทความยอดนิยม

บรรยายสิ่งต่างๆ ให้คนตาบอดเข้าใจได้ไม่ยาก ขอแค่คิดว่าเล่าเรื่องให้เพื่อนฟัง

Stories of Blossom: ไม่ใช่แค่สนุกและคลายเครียด แต่คือเกมที่ออกแบบมาสำหรับการเข้าถึงของคนทุกกลุ่ม

วิธีการติดตั้งและใช้งาน WinCam1.6 โปรแกรมบันทึกวิดีโอบนคอมพิวเตอร์

เบื่อเสียง text to speech ในเครื่องแล้วหรือยัง มาประยุกต์ใช้ Microsoft Edge เพื่ออ่านข้อความให้ฟังกันดีกว่า

“เครื่อง ศรีบัวพันธุ์” บุคคลสำคัญแห่งการนวดคนตาบอดไทย และวงการณ์คนตาบอดไทย

คุณรู้เรื่องนี้หรือยัง?

โพล

กระทู้ใหม่

ช่องทางการติดตาม

เว็บไซต์ที่เกี่ยวข้อง

About Blind living

คุณอยู่ที่

ปลดล็อกองค์ประกอบเสียง: คู่มือการแยกเสียงร้องและดนตรีด้วย Python และ Demucs (ฉบับ Windows)

ปรับขนาดตัวอักษร

Demucs – ขุมพลัง AI แห่งการแยกเสียง

ขั้นตอนที่ 1: ติดตั้ง Python และเตรียมเครื่องมือบน Windows

ขั้นตอนที่ 2: คำสั่งลุยงาน: แยกเสียงร้องด้วย 2 และ 4 องค์ประกอบ

ทางเลือกใหม่ที่คุ้มค่า

Tags:

แสดงความคิดเห็น

ชนะพงษ์ บุญมี

บทความที่เกี่ยวข้อง

บทความยอดนิยม

คุณรู้เรื่องนี้หรือยัง?

โพล

กระทู้ใหม่

ช่องทางการติดตาม

เว็บไซต์ที่เกี่ยวข้อง

About Blind living