இமேஜிங் அமைப்புகளின் தகவல்-உந்துதல் வடிவமைப்பு – பெர்க்லி செயற்கை நுண்ணறிவு ஆராய்ச்சி வலைப்பதிவு

info estimation overview

ஒரு குறியாக்கி (ஆப்டிகல் சிஸ்டம்) பொருள்களை சத்தமில்லாத படங்களுக்கு வரைபடமாக்குகிறது, இது சத்தம் அளவீடுகளாக சிதைகிறது. எங்களின் தகவல் மதிப்பீட்டாளர் இந்த இரைச்சல் அளவீடுகள் மற்றும் ஒரு இரைச்சல் மாதிரியை மட்டுமே அளவீடுகள் பொருட்களை எவ்வாறு வேறுபடுத்துகிறது என்பதைக் கணக்கிட பயன்படுத்துகிறது.

பல இமேஜிங் அமைப்புகள் மனிதர்கள் பார்க்காத அல்லது நேரடியாக விளக்க முடியாத அளவீடுகளை உருவாக்குகின்றன. இறுதிப் புகைப்படத்தை உருவாக்கும் முன், உங்கள் ஸ்மார்ட்ஃபோன் மூல சென்சார் தரவை அல்காரிதம்கள் மூலம் செயலாக்குகிறது. எம்ஆர்ஐ ஸ்கேனர்கள் மருத்துவர்கள் அவற்றைப் பார்ப்பதற்கு முன் மறுகட்டமைப்பு தேவைப்படும் அதிர்வெண்-இட அளவீடுகளைச் சேகரிக்கின்றன. சுய-ஓட்டுநர் கார்கள் கேமரா மற்றும் LiDAR தரவை நேரடியாக நரம்பியல் நெட்வொர்க்குகளுடன் செயலாக்குகின்றன.

இந்த அமைப்புகளில் முக்கியமானது அளவீடுகள் எப்படி இருக்கும் என்பது அல்ல, ஆனால் அவை எவ்வளவு பயனுள்ள தகவல்களைக் கொண்டிருக்கின்றன என்பதுதான். மனிதர்களால் புரிந்துகொள்ள முடியாத வகையில் குறியாக்கம் செய்யப்பட்டாலும் AI இந்தத் தகவலைப் பிரித்தெடுக்க முடியும்.

இன்னும் நாங்கள் தகவல் உள்ளடக்கத்தை நேரடியாக மதிப்பிடுவது அரிது. ரெசல்யூஷன் மற்றும் சிக்னல்-டு-இரைச்சல் விகிதம் போன்ற பாரம்பரிய அளவீடுகள் தரத்தின் தனிப்பட்ட அம்சங்களை தனித்தனியாக மதிப்பிடுகின்றன, இந்த காரணிகளுக்கு இடையில் வர்த்தகம் செய்யும் அமைப்புகளை ஒப்பிடுவது கடினமாகிறது. பொதுவான மாற்று, நரம்பியல் நெட்வொர்க்குகளை புனரமைக்க அல்லது படங்களை வகைப்படுத்துவது, இமேஜிங் வன்பொருளின் தரத்தை அல்காரிதத்தின் தரத்துடன் இணைக்கிறது.

தகவல் உள்ளடக்கத்தின் அடிப்படையில் இமேஜிங் அமைப்புகளின் நேரடி மதிப்பீடு மற்றும் தேர்வுமுறையை செயல்படுத்தும் கட்டமைப்பை நாங்கள் உருவாக்கியுள்ளோம். எங்களில் NeurIPS 2025 தாள்இந்த தகவல் அளவீடு நான்கு இமேஜிங் டொமைன்களில் கணினி செயல்திறனைக் கணிப்பதாகவும், அதை மேம்படுத்துவது குறைந்த நினைவகம், குறைவான கணக்கீடு மற்றும் பணி-குறிப்பிட்ட குறிவிலக்கி வடிவமைப்பு தேவைப்படாமல், அதிநவீன இறுதி முதல் இறுதி முறைகளுடன் பொருந்தக்கூடிய வடிவமைப்புகளை உருவாக்குகிறது என்பதைக் காட்டுகிறோம்.

பரஸ்பர தகவல் ஏன்?

பரஸ்பர தகவல் ஒரு அளவீடு அதை உருவாக்கிய பொருளைப் பற்றிய நிச்சயமற்ற தன்மையைக் குறைக்கிறது. ஒரே பரஸ்பர தகவலைக் கொண்ட இரண்டு அமைப்புகள், அவற்றின் அளவீடுகள் முற்றிலும் வேறுபட்டதாக இருந்தாலும், பொருட்களை வேறுபடுத்தும் திறனில் சமமானவை.

இந்த ஒற்றை எண் தெளிவுத்திறன், சத்தம், மாதிரி மற்றும் அளவீட்டுத் தரத்தைப் பாதிக்கும் பிற காரணிகளின் ஒருங்கிணைந்த விளைவைப் படம்பிடிக்கிறது. பொருள்களை வேறுபடுத்துவதற்குத் தேவையான அம்சங்களைப் பாதுகாக்கும் மங்கலான, சத்தமில்லாத படம், அந்த அம்சங்களை இழக்கும் கூர்மையான, சுத்தமான படத்தைக் காட்டிலும் கூடுதல் தகவல்களைக் கொண்டிருக்கலாம்.

noise res spectrum

தகவல் பாரம்பரியமாக தனித்தனி தர அளவீடுகளை ஒருங்கிணைக்கிறது. இது இரைச்சல், தெளிவுத்திறன் மற்றும் நிறமாலை உணர்திறன் ஆகியவற்றை சுயாதீனமான காரணிகளாகக் கருதுவதற்குப் பதிலாக ஒன்றாகக் கணக்கிடுகிறது.

இமேஜிங்கில் தகவல் கோட்பாட்டைப் பயன்படுத்துவதற்கான முந்தைய முயற்சிகள் இரண்டு சிக்கல்களை எதிர்கொண்டன. முதல் அணுகுமுறை இமேஜிங் அமைப்புகளை கட்டுப்பாடற்ற தொடர்பு சேனல்களாகக் கருதியது, லென்ஸ்கள் மற்றும் சென்சார்களின் உடல் வரம்புகளைப் புறக்கணித்தது. இது மிகவும் தவறான மதிப்பீடுகளை உருவாக்கியது. இரண்டாவது அணுகுமுறைக்கு உருவப்படம் செய்யப்படும் பொருட்களின் வெளிப்படையான மாதிரிகள் தேவை, பொதுத்தன்மையைக் கட்டுப்படுத்துகிறது.

அளவீடுகளிலிருந்து தகவல்களை நேரடியாக மதிப்பிடுவதன் மூலம் எங்கள் முறை இரண்டு சிக்கல்களையும் தவிர்க்கிறது.

அளவீடுகளிலிருந்து தகவல்களை மதிப்பிடுதல்

உயர் பரிமாண மாறிகள் இடையே பரஸ்பர தகவலை மதிப்பிடுவது மிகவும் கடினமானது. மாதிரி தேவைகள் பரிமாணத்துடன் அதிவேகமாக வளர்கின்றன, மேலும் மதிப்பீடுகள் அதிக சார்பு மற்றும் மாறுபாட்டால் பாதிக்கப்படுகின்றன.

இருப்பினும், இமேஜிங் அமைப்புகள் இந்த கடினமான சிக்கலை எளிமையான துணை சிக்கல்களாக சிதைக்கும் பண்புகளைக் கொண்டுள்ளன. பரஸ்பர தகவலை இவ்வாறு எழுதலாம்:

\\[I(X; Y) = H(Y) – H(Y \mid X)\]

முதல் சொல், $H(Y)$, பொருள் வேறுபாடுகள் மற்றும் சத்தம் இரண்டிலிருந்தும் அளவீடுகளில் மொத்த மாறுபாட்டை அளவிடுகிறது. இரண்டாவது சொல், $H(Y \mid X)$, சத்தத்திலிருந்து மட்டும் மாறுபாட்டை அளவிடுகிறது.

entropies decomposition

பரஸ்பர தகவல் மொத்த அளவீட்டு மாறுபாடு மற்றும் சத்தம் மட்டும் மாறுபாடு ஆகியவற்றுக்கு இடையே உள்ள வேறுபாட்டிற்கு சமம்.

இமேஜிங் அமைப்புகள் நன்கு வகைப்படுத்தப்பட்ட இரைச்சலைக் கொண்டுள்ளன. ஃபோட்டான் ஷாட் இரைச்சல் ஒரு பாய்சன் விநியோகத்தைத் தொடர்ந்து வருகிறது. எலக்ட்ரானிக் ரீட்அவுட் சத்தம் காஸியன். இந்த அறியப்பட்ட இரைச்சல் இயற்பியல் என்பது $H(Y \mid X)$ஐ நேரடியாகக் கணக்கிடலாம், மேலும் $H(Y)$ மட்டுமே தரவுகளிலிருந்து கற்றுக்கொள்ள முடியும்.

$H(Y)$க்கு, நிகழ்தகவு மாதிரியை (எ.கா. மின்மாற்றி அல்லது பிற தன்னியக்க மாதிரி) அளவீடுகளின் தரவுத்தொகுப்பில் பொருத்துகிறோம். சாத்தியமான அனைத்து அளவீடுகளின் விநியோகத்தையும் மாதிரி கற்றுக்கொள்கிறது. செயல்திறன்-துல்லியமான பரிமாற்றங்களை உள்ளடக்கிய மூன்று மாடல்களை நாங்கள் சோதித்தோம்: நிலையான காசியன் செயல்முறை (வேகமானது), முழு காஸியன் (இடைநிலை) மற்றும் ஒரு தன்னியக்க பிக்சல்சிஎன்என் (மிகவும் துல்லியமானது). அணுகுமுறை உண்மையான தகவலின் மேல் வரம்பை வழங்குகிறது; எந்தவொரு மாடலிங் பிழையும் மிகையாக மதிப்பிட முடியும், ஒருபோதும் குறைத்து மதிப்பிட முடியாது.

நான்கு இமேஜிங் களங்களில் சரிபார்ப்பு

தகவல் மதிப்பீடுகள், உண்மையான அமைப்புகளை வரம்புக்குட்படுத்துவதைக் கைப்பற்றினால், குறிவிலக்கியின் செயல்திறனைக் கணிக்க வேண்டும். நான்கு இமேஜிங் பயன்பாடுகளில் இந்த உறவைச் சோதித்தோம்.

applications figure

தகவல் மதிப்பீடுகள் வண்ண புகைப்படம் எடுத்தல், ரேடியோ வானியல், லென்ஸ்லெஸ் இமேஜிங் மற்றும் நுண்ணோக்கி ஆகியவற்றில் டிகோடர் செயல்திறனைக் கணிக்கின்றன. உயர் தகவல் தொடர்ந்து கீழ்நிலை பணிகளில் சிறந்த முடிவுகளைத் தருகிறது.

வண்ண புகைப்படம். டிஜிட்டல் கேமராக்கள் குறிப்பிட்ட அலைநீளங்களை மட்டும் கண்டறிய ஒவ்வொரு பிக்சலையும் கட்டுப்படுத்தும் வடிகட்டி வரிசைகளைப் பயன்படுத்தி வண்ணத்தை குறியாக்கம் செய்கின்றன. நாங்கள் மூன்று வடிகட்டி வடிவமைப்புகளை ஒப்பிட்டுப் பார்த்தோம்: பாரம்பரிய பேயர் முறை, ஒரு சீரற்ற ஏற்பாடு மற்றும் ஒரு கற்றல் ஏற்பாடு. எந்த புனரமைப்பு அல்காரிதம் தேவையில்லாமல் நரம்பியல் நெட்வொர்க் டெமோசைசிங்கில் இருந்து தரவரிசைகளை பொருத்தி, எந்த வடிவமைப்புகள் சிறந்த வண்ண புனரமைப்புகளை உருவாக்கும் என்பதை தகவல் மதிப்பீடுகள் சரியாக வரிசைப்படுத்துகின்றன.

வானொலி வானியல். தொலைநோக்கி வரிசைகள் உலகெங்கிலும் உள்ள தளங்களிலிருந்து சமிக்ஞைகளை இணைப்பதன் மூலம் உயர் கோணத் தீர்மானத்தை அடைகின்றன. உகந்த தொலைநோக்கி இருப்பிடங்களைத் தேர்ந்தெடுப்பது கணக்கீட்டு ரீதியாக சிக்கலாகாது, ஏனெனில் ஒவ்வொரு தளத்தின் மதிப்பு மற்ற அனைத்தையும் சார்ந்துள்ளது. தகவல் மதிப்பீடுகள் தொலைநோக்கி உள்ளமைவுகள் முழுவதும் புனரமைப்பு தரத்தை கணித்துள்ளது, விலையுயர்ந்த பட மறுகட்டமைப்பு இல்லாமல் தளத் தேர்வை செயல்படுத்துகிறது.

லென்ஸ் இல்லாத இமேஜிங். லென்ஸ் இல்லாத கேமராக்கள் பாரம்பரிய ஒளியியலுக்கு பதிலாக ஒளி-மாடுலேட்டிங் முகமூடிகள். அவற்றின் அளவீடுகள் காட்சிகளுடன் காட்சி ஒற்றுமையை கொண்டிருக்கவில்லை. லென்ஸ், மைக்ரோலென்ஸ் வரிசை மற்றும் பல்வேறு இரைச்சல் நிலைகளில் டிஃப்பியூசர் வடிவமைப்பு முழுவதும் புனரமைப்பு துல்லியத்தை தகவல் மதிப்பீடுகள் கணித்துள்ளன.

நுண்ணோக்கி. LED வரிசை நுண்ணோக்கிகள் வெவ்வேறு மாறுபாடு முறைகளை உருவாக்க நிரல்படுத்தக்கூடிய வெளிச்சத்தைப் பயன்படுத்துகின்றன. செல் படங்களிலிருந்து புரத வெளிப்பாட்டைக் கணிப்பதில் நரம்பியல் நெட்வொர்க் துல்லியத்துடன் தொடர்புடைய தகவல் மதிப்பீடுகள், விலையுயர்ந்த புரத லேபிளிங் சோதனைகள் இல்லாமல் மதிப்பீட்டை செயல்படுத்துகின்றன.

எல்லா சந்தர்ப்பங்களிலும், உயர் தகவல் சிறந்த கீழ்நிலை செயல்திறனைக் குறிக்கிறது.

ஐடியல் அமைப்புகளை வடிவமைத்தல்

தகவல் மதிப்பீடுகள் ஏற்கனவே உள்ள அமைப்புகளை மதிப்பிடுவதை விட அதிகமாக செய்ய முடியும். இமேஜிங் சிஸ்டம் அளவுருக்களை மேம்படுத்த, தகவல் மதிப்பீடுகளில் எங்கள் தகவல் சார்ந்த என்கோடர் பகுப்பாய்வு கற்றல் (ஐடியல்) முறை சாய்வு ஏற்றத்தைப் பயன்படுத்துகிறது.

IDEAL overview

டிகோடர் நெட்வொர்க் தேவையில்லாமல், தகவல் மதிப்பீடுகளில் கிரேடியண்ட் பின்னூட்டம் மூலம் இமேஜிங் சிஸ்டம் அளவுருக்களை IDEAL மேம்படுத்துகிறது.

கணக்கீட்டு இமேஜிங் வடிவமைப்பிற்கான நிலையான அணுகுமுறை, எண்ட்-டு-எண்ட் ஆப்டிமைசேஷன், இமேஜிங் வன்பொருள் மற்றும் நியூரல் நெட்வொர்க் டிகோடரை கூட்டாக பயிற்றுவிக்கிறது. இதற்கு முழு டிகோடரின் மூலம் மீண்டும் பரப்புதல் தேவைப்படுகிறது, நினைவகக் கட்டுப்பாடுகள் மற்றும் சாத்தியமான தேர்வுமுறை சிக்கல்களை உருவாக்குகிறது.

குறியாக்கியை மட்டும் மேம்படுத்துவதன் மூலம் IDEAL இந்தப் பிரச்சனைகளைத் தவிர்க்கிறது. நாங்கள் அதை வண்ண வடிகட்டி வடிவமைப்பில் சோதித்தோம். சீரற்ற வடிகட்டி ஏற்பாட்டிலிருந்து தொடங்கி, ஐடியல் படிப்படியாக வடிவமைப்பை மேம்படுத்தியது. இறுதி முடிவு, தகவல் உள்ளடக்கம் மற்றும் புனரமைப்புத் தரம் ஆகிய இரண்டிலும் முடிவு-இறுதி தேர்வுமுறையுடன் பொருந்துகிறது.

IDEAL perf

பயிற்சியின் போது டிகோடர் சிக்கலைத் தவிர்க்கும் அதே வேளையில் ஐடியல் எண்ட்-டு-எண்ட் ஆப்டிமைசேஷன் செயல்திறனுடன் பொருந்துகிறது.

தாக்கங்கள்

தகவல் அடிப்படையிலான மதிப்பீடு நிஜ உலக நிலைமைகளில் இமேஜிங் அமைப்புகளின் கடுமையான மதிப்பீட்டிற்கான புதிய சாத்தியங்களை உருவாக்குகிறது. தற்போதைய அணுகுமுறைகளுக்கு அகநிலை காட்சி மதிப்பீடு, வரிசைப்படுத்தலில் கிடைக்காத அடிப்படை உண்மை தரவு அல்லது ஒட்டுமொத்த திறனை இழக்கும் தனிமைப்படுத்தப்பட்ட அளவீடுகள் தேவை. எங்கள் முறையானது, அளவீடுகளிலிருந்து மட்டும் ஒரு புறநிலை, ஒருங்கிணைந்த மெட்ரிக்கை வழங்குகிறது.

IDEAL இன் கணக்கீட்டுத் திறன், முன்னர் சிக்கலற்ற இமேஜிங் அமைப்புகளை வடிவமைப்பதற்கான சாத்தியக்கூறுகளை பரிந்துரைக்கிறது. டிகோடர் பேக்ப்ரோபேகேஷனைத் தவிர்ப்பதன் மூலம், அணுகுமுறை நினைவகத் தேவைகளையும் பயிற்சி சிக்கலையும் குறைக்கிறது. இந்த திறன்களை நாங்கள் இன்னும் விரிவாக ஆராய்வோம் தொடர்ந்து வேலை.

கட்டமைப்பானது இமேஜிங்கைத் தாண்டி மற்ற உணர்திறன் களங்களுக்கு நீட்டிக்கப்படலாம். அறியப்பட்ட இரைச்சல் குணாதிசயங்களுடன் நிர்ணயிக்கப்பட்ட குறியாக்கமாக வடிவமைக்கப்படும் எந்தவொரு அமைப்பும் மின்னணு, உயிரியல் மற்றும் இரசாயன உணரிகள் உட்பட தகவல் அடிப்படையிலான மதிப்பீடு மற்றும் வடிவமைப்பிலிருந்து பயனடையலாம்.

இந்த இடுகை எங்கள் NeurIPS 2025 தாளை அடிப்படையாகக் கொண்டது “இமேஜிங் அமைப்புகளின் தகவல் சார்ந்த வடிவமைப்பு”. குறியீடு கிடைக்கும் கிட்ஹப். ஒரு வீடியோ சுருக்கம் கிடைக்கிறது திட்ட இணையதளம்.

Discover more from Think Daily

Subscribe to get the latest posts sent to your email.

இமேஜிங் அமைப்புகளின் தகவல்-உந்துதல் வடிவமைப்பு – பெர்க்லி செயற்கை நுண்ணறிவு ஆராய்ச்சி வலைப்பதிவு | THINK DAILY

பரஸ்பர தகவல் ஏன்?

அளவீடுகளிலிருந்து தகவல்களை மதிப்பிடுதல்

நான்கு இமேஜிங் களங்களில் சரிபார்ப்பு

ஐடியல் அமைப்புகளை வடிவமைத்தல்

தாக்கங்கள்

Discover more from Think Daily

By ThinkDaily Editorial Team

Leave a Reply Cancel reply

You Missed

ட்ரோன்கள் செயலிழக்க முடியாத அளவுக்கு ஸ்மார்ட்டாகி வருகின்றன | Think Daily

முடிவுகளை எடுப்பது வலியை குறைக்கிறது – MetaDevo | Think Daily

இமேஜிங் அமைப்புகளின் தகவல்-உந்துதல் வடிவமைப்பு – பெர்க்லி செயற்கை நுண்ணறிவு ஆராய்ச்சி வலைப்பதிவு | THINK DAILY

Best Credit Card Signup Bonus Offers in May 2026 | Think Daily

பரஸ்பர தகவல் ஏன்?

அளவீடுகளிலிருந்து தகவல்களை மதிப்பிடுதல்

நான்கு இமேஜிங் களங்களில் சரிபார்ப்பு

ஐடியல் அமைப்புகளை வடிவமைத்தல்

தாக்கங்கள்

Discover more from Think Daily

By ThinkDaily Editorial Team

Related Post

Leave a Reply Cancel reply

You Missed

Discover more from Think Daily