Meta පවසන්නේ තම ImageBind නම් open-source ආකාරයේ AI model එක data ආකාර හයක් සමග කටයුතු කරන්නට සූදානම් multimodal AI එකක් වනු ඇති බවයි. ඔවුන් පැහැදිලි කරන්නේ text, audio, video, 3D, thermal, motion යන ආකාර වලින් මෙම විවිධත්වය සමන්විත වන බවයි. උදාහරණයක් ලෙසට වෙරළ ඡයාරූපයක් සදහා රළ බි‍ඳෙන හඬක් සොයා ගන්නට එයට හැකි වන බවයි. Meta CEO Mark Zuckerberg පැහැදිලි කරන්නේ ක්‍රමයෙන් AI අවකාශයද මිනිසුන් තම අවට ලෝකය සමග ගනුදෙනු කරන ආකාරයට වෙතට පිවිසෙමින් සිටින බවයි. Meta පැහැදිලි කරන්නේ නුදුරේදීම මිනිසා තම බහු සංවේදන හැකියවල් ඔස්සේ ලෝකය හඳුනා ගන්නා ලෙසටම සහය data modes ඔස්සේ touch, speech, smell, brain fMRI signals සමග කටයුතු කරන්නට සූදානම් වීම වඩාත් දියුනු human-centric AI models එකක් වෙතට ගමනක් වනු ඇති බවයි. වැඩි දුරටත් පැහැදිලි කෙරෙන්නේ අද භාවිතාවන බොහොමයක් AI models වලදී text / images මූලික බවක් ගන්නා බවත් ImageBind ඉන් ඉදිරියට යන්නට කටයුතු කරමින් සිටින බවයි.
Pubudu Siriwansa