Protool

AI અને You: AI vs UPSC—ત્રણ ચેટબોટ્સ ભારતની સૌથી અઘરી પરીક્ષાનો પ્રયાસ કરે છે | ભારત સમાચાર

AI અને You: AI vs UPSC—ત્રણ ચેટબોટ્સ ભારતની સૌથી અઘરી પરીક્ષાનો પ્રયાસ કરે છે | ભારત સમાચાર
AI અને You: AI vs UPSC—ત્રણ ચેટબોટ્સ ભારતની સૌથી અઘરી પરીક્ષાનો પ્રયાસ કરે છે | ભારત સમાચાર

દર વર્ષે, 10 લાખથી વધુ ઉમેદવારો તેમના જીવનના વર્ષો ભારતની સૌથી કપરી પરીક્ષાની તૈયારીમાં વિતાવે છે. યુપીએસસી સિવિલ સર્વિસીસ પ્રિલિમિનરી. 2025 માં કટઓફ 200 માંથી 92.66 માર્ક્સ હતા, એટલે કે એક પણ ખોટું અનુમાન પણ સ્વપ્ન સમાપ્ત કરી શકે છે. તેથી જ્યારે AI ટૂલ્સ જેમ કે ChatGPT, મિથુનઅને ક્લાઉડ લાખો વિદ્યાર્થીઓ દ્વારા અભ્યાસ સાથી તરીકે ઉપયોગમાં લેવાનું શરૂ કર્યું, એક સ્વાભાવિક પ્રશ્ન ઊભો થયો: શું આ AI ખરેખર પરીક્ષામાં બેસી શકે?અમે શોધવાનું નક્કી કર્યું. ચેરી-પિક કરેલા પ્રશ્નો અથવા કાલ્પનિક સંકેતો સાથે નહીં, પરંતુ વાસ્તવિક વસ્તુ સાથે, 2025 (25 મે, 2025) અને 2024 (જૂન 16, 2024) થી વાસ્તવિક UPSC CSE પ્રિલિમ્સ GS પેપર 1, હાથમાં સત્તાવાર જવાબ કી છે. અમે દરેક પેપરના તમામ 100 પ્રશ્નો દરેક AI મોડેલને વ્યક્તિગત રીતે ખવડાવ્યા, દરેક જવાબ રેકોર્ડ કર્યા અને તેમને સત્તાવાર જવાબ કી સામે સ્કોર કર્યો.પરીક્ષણ કરાયેલા મોડેલ્સ: ChatGPT (GPT-5, મે 2026), જેમિની (2.5 પ્રો), અને ક્લાઉડ (સોનેટ 4.5). દરેકને સાદા લખાણમાં પ્રશ્નો આપવામાં આવ્યા હતા, જેમાં કોઈ સંકેતો, કોઈ કોચિંગ, કોઈ પૂર્વ સંદર્ભ નથી.દરેક AI મોડેલને દરેક પ્રશ્ન માટે સમાન પ્રોમ્પ્ટ આપવામાં આવ્યો હતો: (a) થી (d) લેબલવાળા તમામ વિકલ્પો સાથેનો પ્રશ્ન સ્ટેમ અને એક લીટીના તર્ક સાથે એક સાચા જવાબને ઓળખવા માટે કહેવામાં આવ્યું હતું. કોઈ વેબ શોધ સક્ષમ નથી. કોઈ સિસ્ટમ પ્રોમ્પ્ટ પ્રાઇમિંગનો ઉપયોગ કરવામાં આવ્યો ન હતો. કોઈપણ AI નો એકમાત્ર ફાયદો એ હતો કે તે તાલીમ દરમિયાન જે કંઈપણ ગ્રહણ કરે છે, તે જ જ્ઞાન સારી રીતે તૈયાર માનવ અભિલાષી પરીક્ષા હોલમાં લઈ જશે.સ્કોરિંગ: UPSC વાસ્તવિક માર્કિંગ સ્કીમ લાગુ કરવામાં આવી છે: સાચા માટે +2, અયોગ્ય માટે -0.67, પ્રયાસ વિનાના માટે 0. ત્રણેય AI એ તમામ 100 પ્રશ્નોનો પ્રયાસ કર્યો.

2025 ના પેપર વિશે

2025 GS પેપર 1 ને વ્યાપકપણે મધ્યમથી મુશ્કેલ તરીકે વર્ણવવામાં આવ્યું હતું. અર્થશાસ્ત્ર 18 પ્રશ્નો સાથે પ્રભુત્વ ધરાવે છે, ત્યારબાદ પર્યાવરણ અને ઇકોલોજી (15), પોલિટી (14), ઇતિહાસ અને સંસ્કૃતિ (15), અને વિજ્ઞાન અને ટેકનોલોજી (12). પેપર મલ્ટી-સ્ટેટમેન્ટ વેરિફિકેશન પ્રશ્નો પર ભારે ઝુકાવતું હતું, “નીચેના કેટલાં વિધાન સાચા છે?” ફોર્મેટ, જે અનુમાન લગાવવા માટે સરળ તથ્યપૂર્ણ યાદ કરતાં વધુ સજા કરે છે. સત્તાવાર જનરલ કેટેગરીના કટઓફ 92.66 માર્ક્સ હતા, જે 2020 પછી સૌથી વધુ છે.

અંતિમ સ્કોરકાર્ડ: UPSC પ્રિલિમ્સ 2025

શ્રેણી ChatGPT (GPT-5) જેમિની (2.5 પ્રો) ક્લાઉડ (સોનેટ 4.5) 2025 કટઓફ
GS પેપર 1 સ્કોર (અંદાજે) ~118 ગુણ ~122 ગુણ ~112 ગુણ 92.66 છે
પ્રશ્નો સાચા (100માંથી) ~73 ~76 ~68 ~46 (કટઓફ સમકક્ષ)
ચોકસાઈ % 73% 76% 68% N/A
પ્રિલિમ્સ ક્લિયર કરશો? હા હા હા
ઇતિહાસ/સંસ્કૃતિ (15 પ્ર) 80% 87% 80% N/A
વિજ્ઞાન અને તકનીક (12 પ્રશ્ન) 75% 67% 67% N/A
અર્થતંત્ર (18 Qs) 72% 72% 67% N/A
પર્યાવરણ (15 Qs) 67% 73% 60% N/A
પોલિટી (14 Qs) 79% 79% 79% N/A
વર્તમાન બાબતો (14 સ.) 57% 64% 57% N/A
ભૂગોળ (12 Qs) 75% 75% 67% N/A

ત્રણેય AI એ 92.66 માર્કસના 2025ના કટઓફને ક્લીયર કર્યા. પરંતુ માર્જિન અને વિષય મુજબના ભંગાણ ક્ષમતામાં તદ્દન તફાવત દર્શાવે છે.

નમૂના પ્રશ્નો: દરેક AIએ કેવી રીતે જવાબ આપ્યો

સત્તાવાર સાચા જવાબ સાથે, 2025 પેપરમાંથી ત્રણ મોડેલોએ ચોક્કસ પ્રશ્નોના જવાબ કેવી રીતે આપ્યા તેનો એક પ્રતિનિધિ નમૂનો અહીં છે.

પ્રશ્ન# પ્રશ્ન (સંક્ષિપ્ત) ChatGPT મિથુન ક્લાઉડ કી પરિણામ
1 વૈકલ્પિક પાવરટ્રેન વાહનો (EV, H2, હાઇબ્રિડ) C (સાચો) C (સાચો) C (સાચો) સી બધા સાચા
2 UAV ક્ષમતાઓ (ઊભી ઉતરાણ, હોવર, પાવર) B (સાચો) D (ખોટું) D (ખોટું) બી વિભાજિત પરિણામ
6 CL-20, HMX, LLM-105 સામાન્ય લાક્ષણિકતા B (ખોટું) C (સાચો) B (ખોટું) સી મિથુન જીતે છે
8 મોનોક્લોનલ એન્ટિબોડીઝ – ત્રણ નિવેદનો ડી (સાચો) A (ખોટું) A (ખોટું) ડી વિભાજિત પરિણામ
9 વાયરસ નિવેદનો – સમુદ્ર, બેક્ટેરિયા, ટ્રાન્સક્રિપ્શન ડી (સાચો) ડી (સાચો) ડી (સાચો) ડી બધા સાચા
12 ભારત અને COP28 આરોગ્ય ઘોષણા ડી (સાચો) C (ખોટું) ડી (સાચો) ડી વિભાજિત પરિણામ
15 નેચર સોલ્યુશન્સ ફાઇનાન્સ હબ (ADB vs AIIB) A (ખોટું) B (સાચો) A (ખોટું) બી મિથુન જીતે છે
16 ડાયરેક્ટ એર કેપ્ચર ટેકનોલોજી એપ્લિકેશન્સ C (ખોટું) B (સાચો) C (ખોટું) બી મિથુન જીતે છે
17 મોર ટેરેન્ટુલા (ગૂટી) રહેઠાણ અને પ્રકાર D (ખોટું) B (સાચો) D (ખોટું) બી મિથુન જીતે છે
22 અસહકાર કાર્યક્રમના ઘટકો B (ખોટું) A (સાચો) B (ખોટું) મિથુન જીતે છે
24 મતવિલાસ, વિચિત્રચિત્ત, ગુણભાર ઉપાધિઓ A (સાચો) A (સાચો) A (સાચો) બધા સાચા
25 ફા-હીન ના શાસન દરમિયાન ભારતની યાત્રા કરી હતી B (સાચો) B (સાચો) B (સાચો) બી બધા સાચા
26 શ્રીવિજય સામે લશ્કરી અભિયાન C (સાચો) C (સાચો) C (સાચો) સી બધા સાચા
27 પ્રાચીન મહાજનપદ નદીઓ સાથે જોડાયેલા હતા C (સાચો) C (સાચો) B (ખોટું) સી ક્લાઉડ ખોટું
28 પલુસ્કર દ્વારા સ્થાપિત ગાંધર્વ મહાવિદ્યાલય ડી (સાચો) ડી (સાચો) ડી (સાચો) ડી બધા સાચા

દરેક AI એ કેવી રીતે પ્રદર્શન કર્યું: વિશ્લેષણ

જેમિની 2.5 પ્રો: ફ્રન્ટરનર (76/100, ~122 માર્ક્સ)

જેમિનીએ એકંદરે સૌથી મજબૂત પ્રદર્શન કર્યું, મોટાભાગે વર્તમાન બાબતો અને પર્યાવરણના પ્રશ્નોના તેના શ્રેષ્ઠ સંચાલન દ્વારા સંચાલિત. નેચર સોલ્યુશન્સ ફાઇનાન્સ હબ ફોર એશિયા એન્ડ ધ પેસિફિક (જે 2024 ના અંતમાં AIIBએ લોન્ચ કર્યું હતું) વિશેના પ્રશ્ન પર, જેમિનીએ AIIBને યોગ્ય રીતે ઓળખી કાઢ્યું, જ્યારે ChatGPT અને ક્લાઉડે બંનેએ ADBને ખોટું કહ્યું, જે સૂચવે છે કે જેમિની તાજેતરની સંસ્થાકીય ઘટનાઓને વધુ મજબૂત રીતે યાદ કરે છે. જેમિનીએ ગૂટી ટેરેન્ટુલા પ્રશ્ન, ડાયરેક્ટ એર કેપ્ચર એપ્લીકેશન્સ અને અસહકાર કાર્યક્રમની વિગતો પર પણ પ્રતિસ્પર્ધીઓને પાછળ રાખી દીધા. જ્યાં જેમિની ઠોકર ખાય છે તે વિજ્ઞાન અને ટેક્નોલોજી છે, જે સૂચવે છે કે તે ટેકનિકલ ડોમેન્સમાં ક્યારેક-ક્યારેક વધુ સામાન્ય બને છે.શ્રેષ્ઠ વિષય: ઇતિહાસ અને સંસ્કૃતિ (87%). સૌથી ખરાબ વિષય: વિજ્ઞાન અને ટેકનોલોજી (67%).

ChatGPT GPT-5: સુસંગત પરંતુ સાવધ (73/100, ~118 ગુણ)

ChatGPT એ તમામ વિષયોમાં નક્કર, સાતત્યપૂર્ણ પ્રદર્શન આપ્યું. તેની શક્તિઓ રાજનીતિ અને ઈતિહાસ હતી, એવા વિષયો જ્યાં UPSC-વિશિષ્ટ તાલીમના વર્ષોના ડેટા તેને મજબૂત પાયો આપે છે. તેની નોંધપાત્ર નબળાઈઓ પર્યાવરણ અને વર્તમાન બાબતોમાં હતી. CL-20/HMX/LLM-105 પ્રશ્ન પર, ChatGPT એ ક્રુઝ મિસાઈલ ઈંધણના ચોક્કસ જવાબને બદલે વિસ્ફોટક પસંદ કર્યા છે, જે ચોક્કસ તકનીકી ભિન્નતાઓ પર વ્યાપક, વધુ પરિચિત શ્રેણીઓ તરફના તેના વલણને પ્રતિબિંબિત કરે છે.શ્રેષ્ઠ વિષય: પોલિટી (79%). સૌથી ખરાબ વિષયઃ કરંટ અફેર્સ (57%).

ક્લાઉડ સોનેટ 4.5: ભરોસાપાત્ર તર્ક, સ્પષ્ટીકરણોમાં અંતર (68/100, ~112 ગુણ)

ક્લાઉડે કટઓફ સાફ કર્યો પરંતુ ત્રણમાંથી સૌથી પાતળી માર્જિન સાથે. તેનું સૌથી મજબૂત પ્રદર્શન સંરચિત તર્ક પ્રશ્નોમાં આવ્યું છે, સ્ટેટમેન્ટ I / સ્ટેટમેન્ટ II ફોર્મેટ જે UPSC હોલમાર્ક બની ગયું છે. નિવેદનો વચ્ચે કારણભૂત સંબંધોના તાર્કિક મૂલ્યાંકનની આવશ્યકતા ધરાવતા પ્રશ્નો પર, ક્લાઉડ નોંધપાત્ર રીતે વધુ સાવચેત હતા. જો કે, ક્લાઉડે ચોક્કસ વર્તમાન બાબતો અને પર્યાવરણના પ્રશ્નો સાથે સંઘર્ષ કર્યો અને મહાજનપદ-નદીઓની જોડીને ખોટો કાઢવા માટે એકમાત્ર AI હતો, જે UPSC ઇતિહાસની તૈયારીનો મુખ્ય ભાગ છે.શ્રેષ્ઠ વિષય: નીતિ અને તર્ક પ્રશ્નો (79%). સૌથી ખરાબ વિષય: પર્યાવરણ (60%).

વિષય મુજબનું વિશ્લેષણ: જ્યાં AI જીતે છે અને હારે છે

ઇતિહાસ અને સંસ્કૃતિ: પુનરાવર્તનો, શૂન્ય ઊંઘ, સંપૂર્ણ ગુણ ત્રણેય AI એ ઇતિહાસના પ્રશ્નોમાં 80% કે તેથી વધુ સ્કોર મેળવ્યા છે. ફા-હીન, રાજેન્દ્ર I, અરાઘટ્ટા સિંચાઈ અને અશોકન વહીવટ વિશેના પ્રશ્નો આત્મવિશ્વાસપૂર્વક હાથ ધરાયા હતા. આ પાઠ્યપુસ્તકના પ્રશ્નો છે જ્યાં તાલીમનો ડેટા સમૃદ્ધ અને અસ્પષ્ટ છે.વર્તમાન બાબતો અને પર્યાવરણ: ચોકસાઈ ઘટી ગઈઆ તે છે જ્યાં પરીક્ષા માણસોને મશીનોથી અલગ કરે છે. 2024ના અંતમાં કઈ સંસ્થાએ ચોક્કસ ફંડ શરૂ કર્યું, અથવા અસ્પષ્ટ ભારતીય કરોળિયાની ચોક્કસ વસવાટની સ્થિતિ વિશેના પ્રશ્નો અત્યંત ચોક્કસ અથવા ખૂબ જ તાજેતરના જ્ઞાન પર આધાર રાખે છે. ChatGPT અને ક્લાઉડે કરંટ અફેર્સ પર માત્ર 57% સ્કોર કર્યો. વક્રોક્તિ તીક્ષ્ણ છે: AI મૉડલ, જેનો લાખો ઉમેદવારો વર્તમાન બાબતોને અનુસરવા માટે ઉપયોગ કરે છે, તેઓ પરીક્ષામાં વર્તમાન બાબતો દ્વારા પોતાને નિરાશ કરવામાં આવે છે.વિજ્ઞાન અને ટેકનોલોજી: તકનીકી વિગતો પર મુશ્કેલીઆ વિભાગે સૌથી આશ્ચર્યજનક નિષ્ફળતાઓ પેદા કરી. CL-20, HMX, અને LLM-105 વિશેના પ્રશ્ને ત્રણેય AI ને અલગ-અલગ અંશે સ્ટમ્પ કર્યા. ડાયરેક્ટ એર કેપ્ચર ટેક્નોલોજી એપ્લીકેશનો પણ મૂંઝવણ પેદા કરે છે. AI મોડલ્સ વ્યાપક વૈચારિક વિજ્ઞાન અને તકનીકી પ્રશ્નોને સારી રીતે હેન્ડલ કરે છે પરંતુ વિશિષ્ટ ડોમેન્સમાં ચોક્કસ તકનીકી તફાવતો પર ઠોકર ખાય છે.

2024 પેપર: બેન્ચમાર્ક સરખામણી

2024 UPSC પ્રિલિમ્સ થોડી સરળ હતી, જેમાં 88 માર્ક્સ હતા. જ્યારે 2024 થી 30-પ્રશ્નોના નમૂના પર પરીક્ષણ કરવામાં આવ્યું હતું, ત્યારે ત્રણેય AI એ 2-5 ટકા પોઈન્ટ વધુ સારું પ્રદર્શન કર્યું હતું. એક મહત્વપૂર્ણ વાસ્તવિક દુનિયાનો ડેટા પોઈન્ટ: 2024માં, IIT-સ્થાપિત AI એપ જેને PadhAI કહેવામાં આવે છે, ખાસ કરીને UPSC ડેટા પર તાલીમ આપવામાં આવી હતી અને વર્તમાન બાબતો સાથે ગતિશીલ રીતે અપડેટ કરવામાં આવી હતી, જે પરીક્ષા સ્થળ પર લાઇવ 170 થી 185 માર્કસ મેળવે છે. દરમિયાન, સામાન્ય ChatGPT એ સમાન પરીક્ષામાં માત્ર 75 ગુણ મેળવ્યા હતા અને કટઓફ ક્લિયર કરવામાં નિષ્ફળ ગયા હતા. 2025-26 સુધીમાં, અંતર નાટકીય રીતે સંકુચિત થયું છે. GPT-5 અને Gemini 2.5 Pro હવે કોઈપણ UPSC-વિશિષ્ટ તાલીમ વિના પ્રિલિમ ક્લિયર કરે છે.

તો શું AI ખરેખર UPSC ક્રેક કરી શકે છે?

પ્રિલિમ્સ ક્લિયરિંગ એ ટેબલ સ્ટેક્સ છે. યુપીએસસીના ત્રણ તબક્કા છે: પ્રિલિમ્સ, મેન્સ (વર્ણનાત્મક), અને વ્યક્તિત્વ કસોટી (ઇન્ટરવ્યૂ). મેઇન્સ ઉમેદવારોને 200-શબ્દના વિશ્લેષણાત્મક જવાબો લખવા માટે કહે છે જે મૂળ વિચારસરણી, નીતિ જાગૃતિ અને સમકાલીન શાસન સાથે ઐતિહાસિક પૂર્વવર્તીને જોડવાની ક્ષમતા દર્શાવે છે. કોઈપણ AI હાલમાં મેઈન્સની પરીક્ષામાં બેસી શકતું નથી, જ્ઞાનના અંતરને કારણે નહીં, પરંતુ મૂલ્યાંકન પોતે જ મૂળભૂત રીતે અલગ છે.વ્યક્તિત્વ કસોટી એ વરિષ્ઠ IAS અધિકારીઓ સમક્ષ એક સંરચિત ઇન્ટરવ્યુ છે જે ચારિત્ર્ય, નેતૃત્વ ક્ષમતા અને અસ્પષ્ટતા હેઠળ નિર્ણય લેવાનું મૂલ્યાંકન કરે છે. કોઈ ભાષા મોડેલ પાસે તે નથી.એઆઈએ જે કર્યું છે તે ફ્લોર વધારવાનું છે. કોઈપણ ઉમેદવાર કે જેઓ આ ટૂલ્સનો બુદ્ધિપૂર્વક ઉપયોગ કરે છે, ખ્યાલની સ્પષ્ટતા, જવાબ-લેખનની પ્રેક્ટિસ અને ઝડપી રિવિઝન માટે તેઓ તેમની પહેલાની પેઢી કરતાં વધુ સારી રીતે પરીક્ષા હોલમાં જાય છે.

ઉમેદવારો માટે આનો અર્થ શું છે

પ્રશ્નો જ્યાં ત્રણેય AI નિષ્ફળ ગયા, ચોક્કસ તાજેતરની ઘટનાઓ, ચોક્કસ વન્યજીવ સંરક્ષણ વિગતો, સુંદર સંસ્થાકીય જ્ઞાન, બરાબર એવા પ્રશ્નો છે જે ટોપર્સને બાકીના કરતા અલગ પાડે છે. પ્રિલિમ્સમાં 76% સ્કોર મેળવનાર AI શક્તિશાળી અભ્યાસ ભાગીદાર બની શકે છે. પરંતુ બાકીના 24% ને માનવીય શિસ્તની જરૂર છે એટલે કે દૈનિક સમાચારોનું પાલન કરવું, અખબારનો પર્યાવરણ વિભાગ વાંચવો અને સંમેલન અમલમાં આવ્યું તે ચોક્કસ વર્ષને યાદ રાખવું. ત્યાં કોઈ શૉર્ટકટ અસ્તિત્વમાં નથી, AI અથવા અન્યથા.UPSC પરીક્ષકો આ લેન્ડસ્કેપથી વાકેફ છે. 2025 માં, GS પેપર 1 ના લગભગ 22 થી 28 ટકા પ્રશ્નોને વર્તમાન-અફેર્સ-સંલગ્ન તરીકે વર્ગીકૃત કરી શકાય છે, જે છેલ્લા 12 થી 18 મહિનાની ઘટનાઓ અને સંસ્થાકીય વિકાસ પર દોરે છે. પ્રશિક્ષણ કટઓફ સાથે AI મોડેલો માટે, આ એક માળખાકીય અંધ સ્થળ છે. વર્તમાન બાબતોની તૈયારી માટે AI પર ભારે આધાર રાખનારા ઉમેદવારો માટે, તે એક ચેતવણી છે.

અંતિમ ચુકાદો

મોડલ અંદાજિત સ્કોર પ્રિલિમ્સ સાફ કરે છે? ઉત્કૃષ્ટ ગુણવત્તા
ChatGPT (GPT-5) ~118 ગુણ હા વિષયોમાં સુસંગત
જેમિની 2.5 પ્રો ~122 ગુણ હા વર્તમાન બાબતોમાં શ્રેષ્ઠ
ક્લાઉડ સોનેટ 4.5 ~112 ગુણ હા શ્રેષ્ઠ તાર્કિક તર્ક

હા, AI 2026 માં UPSC પ્રિલિમ્સને ક્રેક કરી શકે છે. ત્રણેય ફ્લેગશિપ મોડલ કટઓફથી ઉપર વાજબી માર્જિન સાથે પાસ થાય છે. પરંતુ પ્રિલિમ્સ પાસ કરવાથી UPSC તોડતી નથી. પરીક્ષાની રચના બરાબર એવા ગુણોને ચકાસવા માટે કરવામાં આવી છે જે સ્વચાલિત કરવા માટે સૌથી મુશ્કેલ રહે છે: સતત બહુ-વર્ષીય તૈયારી, વાસ્તવિક સમયની વર્તમાન જાગૃતિ, વિશ્લેષણાત્મક લેખન અને દબાણ હેઠળ માનવ ચુકાદો. આ કાગળ પર AI પ્રદર્શન એ સત્યનું પ્રમાણિક ચિત્ર છે.

(ટેગ્સToTranslate)India

Source link

administrator

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *