
ஒரு குறியாக்கி (ஆப்டிகல் சிஸ்டம்) பொருள்களை சத்தமில்லாத படங்களுக்கு வரைபடமாக்குகிறது, இது சத்தம் அளவீடுகளாக சிதைகிறது. எங்களின் தகவல் மதிப்பீட்டாளர் இந்த இரைச்சல் அளவீடுகள் மற்றும் ஒரு இரைச்சல் மாதிரியை மட்டுமே அளவீடுகள் பொருட்களை எவ்வாறு வேறுபடுத்துகிறது என்பதைக் கணக்கிட பயன்படுத்துகிறது.
பல இமேஜிங் அமைப்புகள் மனிதர்கள் பார்க்காத அல்லது நேரடியாக விளக்க முடியாத அளவீடுகளை உருவாக்குகின்றன. இறுதிப் புகைப்படத்தை உருவாக்கும் முன், உங்கள் ஸ்மார்ட்ஃபோன் மூல சென்சார் தரவை அல்காரிதம்கள் மூலம் செயலாக்குகிறது. எம்ஆர்ஐ ஸ்கேனர்கள் மருத்துவர்கள் அவற்றைப் பார்ப்பதற்கு முன் மறுகட்டமைப்பு தேவைப்படும் அதிர்வெண்-இட அளவீடுகளைச் சேகரிக்கின்றன. சுய-ஓட்டுநர் கார்கள் கேமரா மற்றும் LiDAR தரவை நேரடியாக நரம்பியல் நெட்வொர்க்குகளுடன் செயலாக்குகின்றன.
இந்த அமைப்புகளில் முக்கியமானது அளவீடுகள் எப்படி இருக்கும் என்பது அல்ல, ஆனால் அவை எவ்வளவு பயனுள்ள தகவல்களைக் கொண்டிருக்கின்றன என்பதுதான். மனிதர்களால் புரிந்துகொள்ள முடியாத வகையில் குறியாக்கம் செய்யப்பட்டாலும் AI இந்தத் தகவலைப் பிரித்தெடுக்க முடியும்.
இன்னும் நாங்கள் தகவல் உள்ளடக்கத்தை நேரடியாக மதிப்பிடுவது அரிது. ரெசல்யூஷன் மற்றும் சிக்னல்-டு-இரைச்சல் விகிதம் போன்ற பாரம்பரிய அளவீடுகள் தரத்தின் தனிப்பட்ட அம்சங்களை தனித்தனியாக மதிப்பிடுகின்றன, இந்த காரணிகளுக்கு இடையில் வர்த்தகம் செய்யும் அமைப்புகளை ஒப்பிடுவது கடினமாகிறது. பொதுவான மாற்று, நரம்பியல் நெட்வொர்க்குகளை புனரமைக்க அல்லது படங்களை வகைப்படுத்துவது, இமேஜிங் வன்பொருளின் தரத்தை அல்காரிதத்தின் தரத்துடன் இணைக்கிறது.
தகவல் உள்ளடக்கத்தின் அடிப்படையில் இமேஜிங் அமைப்புகளின் நேரடி மதிப்பீடு மற்றும் தேர்வுமுறையை செயல்படுத்தும் கட்டமைப்பை நாங்கள் உருவாக்கியுள்ளோம். எங்களில் NeurIPS 2025 தாள்இந்த தகவல் அளவீடு நான்கு இமேஜிங் டொமைன்களில் கணினி செயல்திறனைக் கணிப்பதாகவும், அதை மேம்படுத்துவது குறைந்த நினைவகம், குறைவான கணக்கீடு மற்றும் பணி-குறிப்பிட்ட குறிவிலக்கி வடிவமைப்பு தேவைப்படாமல், அதிநவீன இறுதி முதல் இறுதி முறைகளுடன் பொருந்தக்கூடிய வடிவமைப்புகளை உருவாக்குகிறது என்பதைக் காட்டுகிறோம்.
பரஸ்பர தகவல் ஏன்?
பரஸ்பர தகவல் ஒரு அளவீடு அதை உருவாக்கிய பொருளைப் பற்றிய நிச்சயமற்ற தன்மையைக் குறைக்கிறது. ஒரே பரஸ்பர தகவலைக் கொண்ட இரண்டு அமைப்புகள், அவற்றின் அளவீடுகள் முற்றிலும் வேறுபட்டதாக இருந்தாலும், பொருட்களை வேறுபடுத்தும் திறனில் சமமானவை.
இந்த ஒற்றை எண் தெளிவுத்திறன், சத்தம், மாதிரி மற்றும் அளவீட்டுத் தரத்தைப் பாதிக்கும் பிற காரணிகளின் ஒருங்கிணைந்த விளைவைப் படம்பிடிக்கிறது. பொருள்களை வேறுபடுத்துவதற்குத் தேவையான அம்சங்களைப் பாதுகாக்கும் மங்கலான, சத்தமில்லாத படம், அந்த அம்சங்களை இழக்கும் கூர்மையான, சுத்தமான படத்தைக் காட்டிலும் கூடுதல் தகவல்களைக் கொண்டிருக்கலாம்.

தகவல் பாரம்பரியமாக தனித்தனி தர அளவீடுகளை ஒருங்கிணைக்கிறது. இது இரைச்சல், தெளிவுத்திறன் மற்றும் நிறமாலை உணர்திறன் ஆகியவற்றை சுயாதீனமான காரணிகளாகக் கருதுவதற்குப் பதிலாக ஒன்றாகக் கணக்கிடுகிறது.
இமேஜிங்கில் தகவல் கோட்பாட்டைப் பயன்படுத்துவதற்கான முந்தைய முயற்சிகள் இரண்டு சிக்கல்களை எதிர்கொண்டன. முதல் அணுகுமுறை இமேஜிங் அமைப்புகளை கட்டுப்பாடற்ற தொடர்பு சேனல்களாகக் கருதியது, லென்ஸ்கள் மற்றும் சென்சார்களின் உடல் வரம்புகளைப் புறக்கணித்தது. இது மிகவும் தவறான மதிப்பீடுகளை உருவாக்கியது. இரண்டாவது அணுகுமுறைக்கு உருவப்படம் செய்யப்படும் பொருட்களின் வெளிப்படையான மாதிரிகள் தேவை, பொதுத்தன்மையைக் கட்டுப்படுத்துகிறது.
அளவீடுகளிலிருந்து தகவல்களை நேரடியாக மதிப்பிடுவதன் மூலம் எங்கள் முறை இரண்டு சிக்கல்களையும் தவிர்க்கிறது.
அளவீடுகளிலிருந்து தகவல்களை மதிப்பிடுதல்
உயர் பரிமாண மாறிகள் இடையே பரஸ்பர தகவலை மதிப்பிடுவது மிகவும் கடினமானது. மாதிரி தேவைகள் பரிமாணத்துடன் அதிவேகமாக வளர்கின்றன, மேலும் மதிப்பீடுகள் அதிக சார்பு மற்றும் மாறுபாட்டால் பாதிக்கப்படுகின்றன.
இருப்பினும், இமேஜிங் அமைப்புகள் இந்த கடினமான சிக்கலை எளிமையான துணை சிக்கல்களாக சிதைக்கும் பண்புகளைக் கொண்டுள்ளன. பரஸ்பர தகவலை இவ்வாறு எழுதலாம்:
\\[I(X; Y) = H(Y) – H(Y \mid X)\]
முதல் சொல், $H(Y)$, பொருள் வேறுபாடுகள் மற்றும் சத்தம் இரண்டிலிருந்தும் அளவீடுகளில் மொத்த மாறுபாட்டை அளவிடுகிறது. இரண்டாவது சொல், $H(Y \mid X)$, சத்தத்திலிருந்து மட்டும் மாறுபாட்டை அளவிடுகிறது.

பரஸ்பர தகவல் மொத்த அளவீட்டு மாறுபாடு மற்றும் சத்தம் மட்டும் மாறுபாடு ஆகியவற்றுக்கு இடையே உள்ள வேறுபாட்டிற்கு சமம்.
இமேஜிங் அமைப்புகள் நன்கு வகைப்படுத்தப்பட்ட இரைச்சலைக் கொண்டுள்ளன. ஃபோட்டான் ஷாட் இரைச்சல் ஒரு பாய்சன் விநியோகத்தைத் தொடர்ந்து வருகிறது. எலக்ட்ரானிக் ரீட்அவுட் சத்தம் காஸியன். இந்த அறியப்பட்ட இரைச்சல் இயற்பியல் என்பது $H(Y \mid X)$ஐ நேரடியாகக் கணக்கிடலாம், மேலும் $H(Y)$ மட்டுமே தரவுகளிலிருந்து கற்றுக்கொள்ள முடியும்.
$H(Y)$க்கு, நிகழ்தகவு மாதிரியை (எ.கா. மின்மாற்றி அல்லது பிற தன்னியக்க மாதிரி) அளவீடுகளின் தரவுத்தொகுப்பில் பொருத்துகிறோம். சாத்தியமான அனைத்து அளவீடுகளின் விநியோகத்தையும் மாதிரி கற்றுக்கொள்கிறது. செயல்திறன்-துல்லியமான பரிமாற்றங்களை உள்ளடக்கிய மூன்று மாடல்களை நாங்கள் சோதித்தோம்: நிலையான காசியன் செயல்முறை (வேகமானது), முழு காஸியன் (இடைநிலை) மற்றும் ஒரு தன்னியக்க பிக்சல்சிஎன்என் (மிகவும் துல்லியமானது). அணுகுமுறை உண்மையான தகவலின் மேல் வரம்பை வழங்குகிறது; எந்தவொரு மாடலிங் பிழையும் மிகையாக மதிப்பிட முடியும், ஒருபோதும் குறைத்து மதிப்பிட முடியாது.
நான்கு இமேஜிங் களங்களில் சரிபார்ப்பு
தகவல் மதிப்பீடுகள், உண்மையான அமைப்புகளை வரம்புக்குட்படுத்துவதைக் கைப்பற்றினால், குறிவிலக்கியின் செயல்திறனைக் கணிக்க வேண்டும். நான்கு இமேஜிங் பயன்பாடுகளில் இந்த உறவைச் சோதித்தோம்.

தகவல் மதிப்பீடுகள் வண்ண புகைப்படம் எடுத்தல், ரேடியோ வானியல், லென்ஸ்லெஸ் இமேஜிங் மற்றும் நுண்ணோக்கி ஆகியவற்றில் டிகோடர் செயல்திறனைக் கணிக்கின்றன. உயர் தகவல் தொடர்ந்து கீழ்நிலை பணிகளில் சிறந்த முடிவுகளைத் தருகிறது.
வண்ண புகைப்படம். டிஜிட்டல் கேமராக்கள் குறிப்பிட்ட அலைநீளங்களை மட்டும் கண்டறிய ஒவ்வொரு பிக்சலையும் கட்டுப்படுத்தும் வடிகட்டி வரிசைகளைப் பயன்படுத்தி வண்ணத்தை குறியாக்கம் செய்கின்றன. நாங்கள் மூன்று வடிகட்டி வடிவமைப்புகளை ஒப்பிட்டுப் பார்த்தோம்: பாரம்பரிய பேயர் முறை, ஒரு சீரற்ற ஏற்பாடு மற்றும் ஒரு கற்றல் ஏற்பாடு. எந்த புனரமைப்பு அல்காரிதம் தேவையில்லாமல் நரம்பியல் நெட்வொர்க் டெமோசைசிங்கில் இருந்து தரவரிசைகளை பொருத்தி, எந்த வடிவமைப்புகள் சிறந்த வண்ண புனரமைப்புகளை உருவாக்கும் என்பதை தகவல் மதிப்பீடுகள் சரியாக வரிசைப்படுத்துகின்றன.
வானொலி வானியல். தொலைநோக்கி வரிசைகள் உலகெங்கிலும் உள்ள தளங்களிலிருந்து சமிக்ஞைகளை இணைப்பதன் மூலம் உயர் கோணத் தீர்மானத்தை அடைகின்றன. உகந்த தொலைநோக்கி இருப்பிடங்களைத் தேர்ந்தெடுப்பது கணக்கீட்டு ரீதியாக சிக்கலாகாது, ஏனெனில் ஒவ்வொரு தளத்தின் மதிப்பு மற்ற அனைத்தையும் சார்ந்துள்ளது. தகவல் மதிப்பீடுகள் தொலைநோக்கி உள்ளமைவுகள் முழுவதும் புனரமைப்பு தரத்தை கணித்துள்ளது, விலையுயர்ந்த பட மறுகட்டமைப்பு இல்லாமல் தளத் தேர்வை செயல்படுத்துகிறது.
லென்ஸ் இல்லாத இமேஜிங். லென்ஸ் இல்லாத கேமராக்கள் பாரம்பரிய ஒளியியலுக்கு பதிலாக ஒளி-மாடுலேட்டிங் முகமூடிகள். அவற்றின் அளவீடுகள் காட்சிகளுடன் காட்சி ஒற்றுமையை கொண்டிருக்கவில்லை. லென்ஸ், மைக்ரோலென்ஸ் வரிசை மற்றும் பல்வேறு இரைச்சல் நிலைகளில் டிஃப்பியூசர் வடிவமைப்பு முழுவதும் புனரமைப்பு துல்லியத்தை தகவல் மதிப்பீடுகள் கணித்துள்ளன.
நுண்ணோக்கி. LED வரிசை நுண்ணோக்கிகள் வெவ்வேறு மாறுபாடு முறைகளை உருவாக்க நிரல்படுத்தக்கூடிய வெளிச்சத்தைப் பயன்படுத்துகின்றன. செல் படங்களிலிருந்து புரத வெளிப்பாட்டைக் கணிப்பதில் நரம்பியல் நெட்வொர்க் துல்லியத்துடன் தொடர்புடைய தகவல் மதிப்பீடுகள், விலையுயர்ந்த புரத லேபிளிங் சோதனைகள் இல்லாமல் மதிப்பீட்டை செயல்படுத்துகின்றன.
எல்லா சந்தர்ப்பங்களிலும், உயர் தகவல் சிறந்த கீழ்நிலை செயல்திறனைக் குறிக்கிறது.
ஐடியல் அமைப்புகளை வடிவமைத்தல்
தகவல் மதிப்பீடுகள் ஏற்கனவே உள்ள அமைப்புகளை மதிப்பிடுவதை விட அதிகமாக செய்ய முடியும். இமேஜிங் சிஸ்டம் அளவுருக்களை மேம்படுத்த, தகவல் மதிப்பீடுகளில் எங்கள் தகவல் சார்ந்த என்கோடர் பகுப்பாய்வு கற்றல் (ஐடியல்) முறை சாய்வு ஏற்றத்தைப் பயன்படுத்துகிறது.

டிகோடர் நெட்வொர்க் தேவையில்லாமல், தகவல் மதிப்பீடுகளில் கிரேடியண்ட் பின்னூட்டம் மூலம் இமேஜிங் சிஸ்டம் அளவுருக்களை IDEAL மேம்படுத்துகிறது.
கணக்கீட்டு இமேஜிங் வடிவமைப்பிற்கான நிலையான அணுகுமுறை, எண்ட்-டு-எண்ட் ஆப்டிமைசேஷன், இமேஜிங் வன்பொருள் மற்றும் நியூரல் நெட்வொர்க் டிகோடரை கூட்டாக பயிற்றுவிக்கிறது. இதற்கு முழு டிகோடரின் மூலம் மீண்டும் பரப்புதல் தேவைப்படுகிறது, நினைவகக் கட்டுப்பாடுகள் மற்றும் சாத்தியமான தேர்வுமுறை சிக்கல்களை உருவாக்குகிறது.
குறியாக்கியை மட்டும் மேம்படுத்துவதன் மூலம் IDEAL இந்தப் பிரச்சனைகளைத் தவிர்க்கிறது. நாங்கள் அதை வண்ண வடிகட்டி வடிவமைப்பில் சோதித்தோம். சீரற்ற வடிகட்டி ஏற்பாட்டிலிருந்து தொடங்கி, ஐடியல் படிப்படியாக வடிவமைப்பை மேம்படுத்தியது. இறுதி முடிவு, தகவல் உள்ளடக்கம் மற்றும் புனரமைப்புத் தரம் ஆகிய இரண்டிலும் முடிவு-இறுதி தேர்வுமுறையுடன் பொருந்துகிறது.

பயிற்சியின் போது டிகோடர் சிக்கலைத் தவிர்க்கும் அதே வேளையில் ஐடியல் எண்ட்-டு-எண்ட் ஆப்டிமைசேஷன் செயல்திறனுடன் பொருந்துகிறது.
தாக்கங்கள்
தகவல் அடிப்படையிலான மதிப்பீடு நிஜ உலக நிலைமைகளில் இமேஜிங் அமைப்புகளின் கடுமையான மதிப்பீட்டிற்கான புதிய சாத்தியங்களை உருவாக்குகிறது. தற்போதைய அணுகுமுறைகளுக்கு அகநிலை காட்சி மதிப்பீடு, வரிசைப்படுத்தலில் கிடைக்காத அடிப்படை உண்மை தரவு அல்லது ஒட்டுமொத்த திறனை இழக்கும் தனிமைப்படுத்தப்பட்ட அளவீடுகள் தேவை. எங்கள் முறையானது, அளவீடுகளிலிருந்து மட்டும் ஒரு புறநிலை, ஒருங்கிணைந்த மெட்ரிக்கை வழங்குகிறது.
IDEAL இன் கணக்கீட்டுத் திறன், முன்னர் சிக்கலற்ற இமேஜிங் அமைப்புகளை வடிவமைப்பதற்கான சாத்தியக்கூறுகளை பரிந்துரைக்கிறது. டிகோடர் பேக்ப்ரோபேகேஷனைத் தவிர்ப்பதன் மூலம், அணுகுமுறை நினைவகத் தேவைகளையும் பயிற்சி சிக்கலையும் குறைக்கிறது. இந்த திறன்களை நாங்கள் இன்னும் விரிவாக ஆராய்வோம் தொடர்ந்து வேலை.
கட்டமைப்பானது இமேஜிங்கைத் தாண்டி மற்ற உணர்திறன் களங்களுக்கு நீட்டிக்கப்படலாம். அறியப்பட்ட இரைச்சல் குணாதிசயங்களுடன் நிர்ணயிக்கப்பட்ட குறியாக்கமாக வடிவமைக்கப்படும் எந்தவொரு அமைப்பும் மின்னணு, உயிரியல் மற்றும் இரசாயன உணரிகள் உட்பட தகவல் அடிப்படையிலான மதிப்பீடு மற்றும் வடிவமைப்பிலிருந்து பயனடையலாம்.
இந்த இடுகை எங்கள் NeurIPS 2025 தாளை அடிப்படையாகக் கொண்டது “இமேஜிங் அமைப்புகளின் தகவல் சார்ந்த வடிவமைப்பு”. குறியீடு கிடைக்கும் கிட்ஹப். ஒரு வீடியோ சுருக்கம் கிடைக்கிறது திட்ட இணையதளம்.
Discover more from Think Daily
Subscribe to get the latest posts sent to your email.

