Hacker News

किन पहिलो C++ (m) आवंटन सधैं 72 KB हुन्छ?

टिप्पणीहरू

March 1, 2026 1 min read Via joelsiks.com

Mewayz Team

Editorial Team

Hacker News

तपाईँको पहिलो C++ आवंटन पछाडिको रहस्य

तपाईँले एउटा साधारण C++ प्रोग्राम लेख्नुहुन्छ। एकल नयाँ int। चार बाइट्स। तपाईंले स्ट्रेस वा तपाईंको मनपर्ने मेमोरी प्रोफाइलरलाई फायर गर्नुभयो, र त्यहाँ छ — तपाईंको प्रक्रियाले अपरेटिङ सिस्टमबाट लगभग ७२ KB अनुरोध गरेको छ। 4 बाइट होइन। ६४ बाइट होइन। पूर्ण 72 KB। यदि तपाईंले कहिल्यै त्यो नम्बरमा हेरिरहनुभएको छ र सोच्नुभएको छ कि तपाईंको उपकरणले तपाईंलाई झूट बोलिरहेको छ कि छैन, तपाईं एक्लै हुनुहुन्न। यो विचित्र देखिने व्यवहार C++ विकासकर्ताहरू बीचमा पहिलो पटक मेमोरी इन्टरनलमा खन्ने प्रायः सोधिने प्रश्नहरू मध्ये एक हो, र जवाफले हामीलाई तपाईंको कोड र वास्तविक हार्डवेयर बीचमा बस्ने तहहरू मार्फत एक आकर्षक यात्रामा लैजान्छ।

तपाईंले नयाँ

कल गर्दा के हुन्छ

७२ KB फिगर बुझ्नको लागि, तपाईंले पूर्ण आवंटन श्रृंखला ट्रेस गर्न आवश्यक छ। जब तपाइँको C++ कोडले नयाँ int कार्यान्वयन गर्छ, कम्पाइलरले यसलाई अपरेटर नयाँ लाई कलमा अनुवाद गर्दछ, जुन धेरै लिनक्स प्रणालीहरूमा glibc बाट malloc लाई प्रतिनिधि गर्दछ। तर malloc ले सिधै कर्नेललाई ४ बाइट मेमोरीको लागि सोध्दैन। कर्नेलले पृष्ठहरूमा काम गर्छ - x86_64 मा सामान्यतया 4 KB - र प्रणाली कलको लागत साधारण मेमोरी पहुँचको तुलनामा ठूलो हुन्छ। प्रत्येक व्यक्तिगत विनियोजनको लागि brk() वा mmap() लाई कल गर्नाले कुनै पनि गैर-तुच्छ कार्यक्रमलाई रोकिनेछ।

बरु, glibc को मेमोरी एलोकेटर - ptmalloc2 भनिने कार्यान्वयन, आफै डग लीको क्लासिक dlmalloc बाट आएको हो — मध्यस्थको रूपमा कार्य गर्दछ। यसले कर्नेल अपफ्रन्टबाट मेमोरीको ठूला ब्लकहरू अनुरोध गर्दछ, त्यसपछि तिनीहरूलाई साना टुक्राहरूमा कोर्छ जुन तपाईंको कार्यक्रमलाई आवश्यक हुन्छ। यो मौलिक कारण हो कि तपाईंको पहिलो 4-बाइट आवंटनले अपरेटिङ सिस्टममा धेरै ठूलो अनुरोध ट्रिगर गर्दछ। विनियोजनकर्ता बर्बाद भइरहेको छैन। यो रणनीतिक भइरहेको छ।

72 KB विच्छेदन: जहाँ बाइटहरू जान्छन्

प्रारम्भिक आवंटन ओभरहेड धेरै फरक कम्पोनेन्टहरूबाट आउँदछ जुन रनटाइमले तपाईंलाई प्रयोगयोग्य मेमोरीको एक बाइट पनि हस्तान्तरण गर्नु अघि सुरु गर्नुपर्छ। प्रत्येक कम्पोनेन्टलाई बुझ्दा संख्याले किन त्यहाँ पुग्छ भनेर बताउँछ।

पहिले, glibc को malloc ले मुख्य एरेना लाई प्रारम्भ गर्दछ — प्राथमिक बहीखाता संरचना जसले मुख्य थ्रेडमा सबै आवंटनहरू ट्र्याक गर्दछ। यस एरेनाले हिप, फ्री-लिस्ट पोइन्टर्स, र विभिन्न आवंटन आकारहरूको लागि बिन संरचनाहरूको लागि मेटाडेटा समावेश गर्दछ। आवंटकले sbrk() मार्फत कार्यक्रम ब्रेक विस्तार गर्दछ, र प्रारम्भिक विस्तारलाई M_TOP_PAD भनिने आन्तरिक प्यारामिटरद्वारा नियन्त्रित गरिन्छ, जुन 128 KB प्याडिङमा पूर्वनिर्धारित हुन्छ। यद्यपि, वास्तविक प्रारम्भिक अनुरोध पृष्ठ पङ्क्तिबद्धता र अवस्थित ब्रेक स्थितिको लागि समायोजन गरिएको छ, जसले प्रायः सानो पहिलो अनुरोधमा परिणाम दिन्छ — सामान्यतया नयाँ सुरु भएको प्रक्रियामा त्यो ७२ KB फिगरको नजिक अवतरण हुन्छ।

दोस्रो, glibc २.२६ देखि, विनियोजनकर्ताले पहिलो प्रयोगमा थ्रेड-लोकल क्यास (tcache) सुरु गर्छ। tcache मा 64 bins (एक प्रति सानो-विनियोजन आकार वर्ग) समावेश गर्दछ, प्रत्येक 7 क्यास खण्ड सम्म समात्न सक्षम। tcache_perthread_struct आफैले लगभग 1 KB खपत गर्छ, तर यसलाई प्रारम्भ गर्ने कार्यले फराकिलो एरेना सेटअपलाई ट्रिगर गर्दछ। तेस्रो, C++ रनटाइमले तपाईँको main() रन अघि नै आवंटन गरिसकेको छ — स्थिर कन्स्ट्रक्टरहरू, std::cout र साथीहरूको लागि iostream बफर प्रारम्भिकरण, र लोकेल सेटअप सबैले त्यो प्रारम्भिक हिप फुटप्रिन्टमा योगदान गर्दछ।

एरेना प्रणाली र किन पूर्व-विनियोजन स्मार्ट छ

यसलाई टुक्राटुक्रा अनुरोध गर्नुको सट्टा मेमोरीको पर्याप्त भाग पूर्व-विनियोजन गर्ने निर्णय कार्यान्वयनको दुर्घटना होइन। यो एक जानाजानी ईन्जिनियरिङ् ट्रेडअफ प्रणाली प्रोग्रामिङ अनुभव को दशकहरु मा जरा हो। brk() वा mmap() लाई प्रत्येक कलमा प्रयोगकर्ता स्पेसबाट कर्नेल स्पेसमा सन्दर्भ स्विच, प्रक्रियाको भर्चुअल मेमोरी म्यापिङको परिमार्जन, र सम्भावित पृष्ठ तालिका अपडेटहरू समावेश हुन्छन्। आधुनिक हार्डवेयरमा, एकल प्रणाली कलको लागत लगभग १००-२०० नानोसेकेन्ड हुन्छ — अलगावमा मामूली, स्केलमा विनाशकारी।

प्रारम्भिक समयमा १०,००० सानो आवंटन गर्ने कार्यक्रमलाई विचार गर्नुहोस्। पूर्व-विनियोजन बिना, यसको मतलब 10,000 प्रणाली कलहरू हुनेछ, लगभग 1-2 मिलिसेकेन्ड शुद्ध ओभरहेडको लागत। एरेना-आधारित एलोकेटरको साथ, पहिलो आवंटनले एकल प्रणाली कल ट्रिगर गर्दछ, र त्यसपछिका 9,999 आवंटनहरू प्रयोगकर्ता स्पेसमा पोइन्टर अंकगणित र लिङ्क गरिएको-सूची सञ्चालनहरू मार्फत पूर्ण रूपमा सेवा गरिन्छ — प्रत्येकले लगभग 10-50 नानोसेकेन्डहरू लिन्छ। गणित अस्पष्ट छ: पूर्व-विनियोजन परिमाण को आदेश द्वारा जीत।

तपाईँले आफ्नो पहिलो आवंटनमा देख्नु भएको ७२ KB मेमोरी बर्बाद होइन - यो एक प्रदर्शन लगानी हो। तपाईंको कार्यक्रमले चाँडै नै थप आवंटनहरू गर्नेछ र लगभग हरेक वास्तविक-विश्व परिदृश्यमा, त्यो बाजीले राम्रोसँग भुक्तानी गर्छ भनी आबंटकले शर्त लगाइरहेको छ। अप्रयुक्त भर्चुअल ठेगाना स्पेसको लागत आधुनिक 64-बिट प्रणालीहरूमा अनिवार्य रूपमा शून्य छ।

भर्चुअल मेमोरी बनाम भौतिक मेमोरी: किन यो फरक पर्दैन

पहिलो पटक यो व्यवहारको सामना गर्ने विकासकर्ताहरू बीचको एउटा साझा चिन्ता भनेको स्रोतको बर्बादी हो। यदि मलाई केवल 4 बाइटहरू चाहिन्छ भने, मेरो कार्यक्रमले किन 72 KB खपत गरिरहेको छ? महत्वपूर्ण अन्तरदृष्टि यो हो कि भर्चुअल मेमोरी भौतिक मेमोरी होइन। जब glibc ले कार्यक्रम ब्रेकलाई ७२ KB ले विस्तार गर्छ, कर्नेलले प्रक्रियाको भर्चुअल मेमोरी म्यापिङहरू अद्यावधिक गर्छ, तर यसले ती पृष्ठहरूलाई भौतिक RAM सँग तुरुन्तै ब्याक गर्दैन। वास्तविक भौतिक पृष्ठहरू पृष्ठ त्रुटिहरू मार्फत मागमा आवंटित हुन्छन् — जब तपाइँको कार्यक्रमले कुनै निश्चित ठेगानामा लेख्छ तब मात्र कर्नेलले यसलाई मेमोरीको वास्तविक पृष्ठ प्रदान गर्दछ।

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

यसको मतलब यो हो कि तपाईंको प्रक्रियाको भर्चुअल साइज ७२ KB ले बढे पनि, यसको निवासी सेट साइज (RSS) - वास्तवमा खपत भएको भौतिक RAM को मात्रा - तपाईंले वास्तवमा छुने पृष्ठहरू मात्र बढ्छ। एकल नयाँ int को लागि, त्यो सामान्यतया एक 4 KB पृष्ठ हो, साथै एरेना मेटाडेटाले ओगटेको जुनसुकै पृष्ठहरू। बाँकी भर्चुअल स्पेस त्यहाँ बस्छ, प्रयोगको लागि तयार छ, ठेगाना स्पेस बाहेक अरू केही लागत छैन — जसमध्ये तपाईंसँग 64-बिट लिनक्स प्रणालीमा 128 TB छ।

उत्पादन अनुप्रयोगहरूको प्रोफाइल र अनुगमन गर्दा यो भिन्नता महत्त्वपूर्ण हुन्छ। यदि तपाइँ सफ्टवेयर निर्माण गर्दै हुनुहुन्छ जुन वास्तविक स्रोत खपत ट्र्याक गर्न आवश्यक छ - चाहे यो SaaS ब्याकएन्ड हो, एक माइक्रोसर्भिस हो, वा व्यापार सञ्चालनका लागि Mewayz जस्ता प्लेटफर्महरूमा चल्ने एनालिटिक्स पाइपलाइन हो - तपाइँ सधैँ भर्चुअल आकारको सट्टा RSS निगरानी गर्नुपर्छ। /proc/[pid]/smaps, valgrind --tool=massif, र pmap जस्ता उपकरणहरूले भर्चुअल मेमोरी फिगरहरूलाई भ्रामक बनाउनुको सट्टा सही भौतिक मेमोरी फुटप्रिन्टहरू दिन सक्छ।

विभिन्न आवंटकहरूले पहिलो आवंटनलाई कसरी ह्यान्डल गर्छन्

72 KB फिगर glibc को ptmalloc2 को लागि विशिष्ट छ। अन्य आवंटकहरूले विभिन्न ट्रेडअफहरू बनाउँछन्, र प्रारम्भिक आवंटन ओभरहेड तदनुसार भिन्न हुन्छ। प्रदर्शन-संवेदनशील अनुप्रयोगहरूको लागि विनियोजनकर्ता छनौट गर्दा यी भिन्नताहरू बुझ्न महत्त्वपूर्ण छ।

jemalloc (Facebook, FreeBSD द्वारा प्रयोग गरिएको) — थ्रेड-स्थानीय क्यासहरूसँग थप दानेदार एरेना संरचना प्रयोग गर्दछ। प्रारम्भिक ओभरहेड उच्च हुन्छ (प्रायः २००+ KB) तर कम लक विवादको कारणले राम्रो बहु-थ्रेडेड प्रदर्शन प्रदान गर्दछ।
tcmalloc (Google को Thread-Caching Malloc) — पूर्वनिर्धारित रूपमा लगभग 2 MB को प्रति-थ्रेड क्यास आवंटित गर्दछ, आक्रामक पूर्व-विनियोजनको साथ। प्रारम्भिक ओभरहेड उच्च छ, तर पछिको सानो आवंटन अत्यन्त छिटो छ।
musl libc's malloc — सबै आवंटनहरूको लागि mmap मा आधारित धेरै सरल डिजाइन प्रयोग गर्दछ। प्रारम्भिक ओभरहेड न्यूनतम छ (प्रायः प्रति आवंटन मात्र 4 KB), तर अधिक बारम्बार प्रणाली कलहरूको कारण प्रति-विनियोजन लागत बढी छ।
mimalloc (Microsoft) — 64 MB खण्डहरूसँग खण्ड-आधारित आवंटन प्रयोग गर्दछ। पहिलो आवंटनले 64 MB भर्चुअल रिजर्भेसन ट्रिगर गर्दछ (न्यूनतम भौतिक प्रतिबद्धताको साथ), असाधारण स्थान र थ्रुपुटको लागि व्यापार ठेगाना ठाउँ।

यी विनियोजनकर्ताहरू बीचको छनोट पूर्णतया तपाईंको कार्यभारमा निर्भर गर्दछ। भारी बहु-थ्रेडेड विनियोजनको साथ लामो-चलिरहेको सर्भर अनुप्रयोगहरूको लागि, jemalloc वा tcmalloc ले सामान्यतया glibc को पूर्वनिर्धारित प्रदर्शन गर्दछ। मेमोरी-प्रतिबन्धित एम्बेडेड प्रणालीहरूको लागि, कम थ्रुपुटको बाबजुद मुसलको सरल दृष्टिकोण उपयुक्त हुन सक्छ। धेरैजसो सामान्य-उद्देश्य डेस्कटप र सर्भर अनुप्रयोगहरूको लागि, ptmalloc2 को 72 KB प्रारम्भिक ओभरहेडले एक उचित पूर्वनिर्धारित प्रतिनिधित्व गर्दछ जुन ट्युनिङ बिना राम्रोसँग काम गर्दछ।

प्रारम्भिक आवंटन व्यवहार ट्यून गर्दै

यदि पूर्वनिर्धारित 72 KB प्रारम्भिक ओभरहेड तपाईंको प्रयोग केसको लागि साँच्चिकै समस्याग्रस्त छ — सायद तपाईंले हजारौं अल्पकालीन प्रक्रियाहरू फैलाउँदै हुनुहुन्छ, प्रत्येकले थोरै मात्र आवंटनहरू बनाउँदै हुनुहुन्छ — glibc ले mallopt() र MALLOC_परिवारहरू मार्फत धेरै ट्युनेबलहरू प्रदान गर्दछ।

M_TOP_PAD प्यारामिटरले विनियोजनकर्ताले तुरुन्तै आवश्यक पर्नेभन्दा बढी मेमोरीको अनुरोध गरेको नियन्त्रण गर्छ। यसलाई mallopt(M_TOP_PAD, 0) सँग ० मा सेट गर्नाले विनियोजनकर्तालाई आवश्यक पर्ने मात्र अनुरोध गर्न बताउँछ, प्रारम्भिक ओभरहेडलाई उल्लेखनीय रूपमा घटाउँदै। M_MMAP_THRESHOLD प्यारामिटरले एरेनाको सट्टा mmap प्रयोग गर्ने माथिको आकारलाई नियन्त्रण गर्दछ। M_TRIM_THRESHOLD ले OS मा खाली मेमोरी फर्काउँदा नियन्त्रण गर्छ। र glibc 2.26 देखि, glibc.malloc.tcache_count र glibc.malloc.tcache_max ट्युनेबलहरूले तपाईंलाई थ्रेड क्यास व्यवहार नियन्त्रण गर्न दिन्छ।

यद्यपि, सावधानीको एक शब्द: होसियार बेन्चमार्किङ बिना यी प्यारामिटरहरू ट्युन गर्नाले चीजहरू खराब बनाउँछ। पूर्वनिर्धारितहरू व्यापक वास्तविक-विश्व प्रोफाइलिङको आधारमा छनोट गरिएको थियो, र तिनीहरूले कार्यभारहरूको विशाल बहुमतको लागि मीठो स्थान प्रतिनिधित्व गर्दछ। जबसम्म तपाईंसँग उत्पादन प्रोफाइलिङबाट बलियो प्रमाण छैन कि malloc ओभरहेड एक बाधा हो - र तपाईंले आफ्नो परिवर्तनहरूको प्रभाव मापन गर्नुभएको छ - पूर्वनिर्धारितहरू एक्लै छोड्नुहोस्। आवंटकको समयपूर्व अनुकूलन याक शेभिङको विशेष रूपले कपटी रूप हो जसले नगण्य लाभको लागि अनगिन्ती इन्जिनियरिङ घण्टाहरू खपत गरेको छ।

यसले हामीलाई सिस्टम प्रोग्रामिङको बारेमा के सिकाउँछ

72 KB पहिलो-विनियोजन रहस्य, यसको मूलमा, अमूर्त तहहरू को बारेमा पाठ हो। C++ ले तपाईंलाई नयाँ int 4 बाइटहरू आवंटित गर्ने भ्रम दिन्छ। भाषाको मापदण्डले त्यही भन्छ । तपाईको मानसिक मोडेलले त्यसो भन्छ। तर तपाईंको कोड र हार्डवेयर बीचमा परिष्कृत प्रणालीहरूको स्ट्याक बस्छ — C++ रनटाइम, C लाइब्रेरी आवंटक, कर्नेलको भर्चुअल मेमोरी सबसिस्टम, र हार्डवेयरको MMU र TLB — प्रत्येकले आफ्नै व्यवहार, अप्टिमाइजेसनहरू, र ओभरहेड थप्दै।

यो कुनै दोष होइन। यो प्रणाली सफ्टवेयर को सम्पूर्ण बिन्दु हो। प्रत्येक तह वास्तविक समस्या समाधान गर्न अवस्थित छ: आवंटक अवस्थित छ त्यसैले तपाईंले प्रत्येक आवंटनको लागि प्रणाली कलहरू गर्नुपर्दैन। भर्चुअल मेमोरी प्रणाली अवस्थित छ त्यसैले तपाईंले प्रत्यक्ष रूपमा भौतिक मेमोरी व्यवस्थापन गर्नुपर्दैन। पृष्ठ त्रुटि ह्यान्डलर अवस्थित छ त्यसैले मेमोरी अल्छी र कुशलतापूर्वक प्रतिबद्ध छ। प्रत्येक तहले ठूलो मात्रामा प्रदर्शन र सुविधाको लागि पारदर्शिताको सानो मात्रामा व्यापार गर्दछ।

सबैभन्दा भरपर्दो, उच्च प्रदर्शन गर्ने प्रणालीहरू निर्माण गर्ने विकासकर्ताहरू यी तहहरू बुझ्छन् — किनभने तिनीहरूले तिनीहरूको बारेमा निरन्तर सोच्नुपर्छ भन्ने होइन, तर जब केही अप्रत्याशित हुन्छ (जस्तै रहस्यमय 72 KB आवंटन), तिनीहरूसँग किन बुझ्ने मानसिक मोडेल हुन्छ। तपाईं वास्तविक-समय व्यापार प्रणाली, खेल इन्जिन, वा हजारौं प्रयोगकर्ताहरूलाई सेवा दिने व्यापार प्लेटफर्म निर्माण गर्दै हुनुहुन्छ भने, तपाईंको कोडले प्रणाली स्तरमा वास्तवमा के गर्छ भन्ने तर्क गर्ने क्षमताले सक्षम विकासकर्ताहरूलाई असाधारण व्यक्तिहरूबाट अलग गर्छ। 72 KB कुनै बग होइन। यो तपाइँको विनियोजनकर्ता हो जसले आफ्नो काम शानदार रूपमा गरिरहेको छ।

आज नै आफ्नो व्यापार ओएस बनाउनुहोस्

फ्रीलान्सरदेखि एजेन्सीसम्म, Mewayz ले २०७ एकीकृत मोड्युलहरूका साथ १३८,०००+ व्यवसायहरूलाई शक्ति दिन्छ। नि:शुल्क सुरु गर्नुहोस्, जब तपाईं बढ्नुहुन्छ अपग्रेड गर्नुहोस्।

नि:शुल्क खाता बनाउनुहोस् →

Try Mewayz Free

All-in-one platform for CRM, invoicing, projects, HR & more. No credit card required.

Start Free Try Demo

Start managing your business smarter today

Join 6,210+ businesses. Free forever plan · No credit card required.

Start Free → Watch Demo

Found this useful? Share it.

X / Twitter LinkedIn Facebook WhatsApp

Ready to put this into practice?

Join 6,210+ businesses using Mewayz. Free forever plan — no credit card required.

Start Free Trial →

Hacker News

Global growth in solar "the largest ever observed for any source"

Apr 22, 2026

Hacker News

San Diego rents declined more than 19 of 20 top US markets after surge in supply

Apr 22, 2026

Hacker News

I'm Sick of AI Everything

Apr 22, 2026

Hacker News

Drunk Post: Things I've Learned as a Senior Engineer

Apr 21, 2026

Hacker News

Claude Code to be removed from Pro Tier?

Apr 21, 2026

Hacker News

SpaceX Strikes Deal With Cursor for $60 Billion

Apr 21, 2026

Ready to take action?

Start your free Mewayz trial today

All-in-one business platform. No credit card required.

Start Free →

14-day free trial · No credit card · Cancel anytime

किन पहिलो C++ (m) आवंटन सधैं 72 KB हुन्छ?

तपाईँको पहिलो C++ आवंटन पछाडिको रहस्य

तपाईंले नयाँ

72 KB विच्छेदन: जहाँ बाइटहरू जान्छन्

एरेना प्रणाली र किन पूर्व-विनियोजन स्मार्ट छ

भर्चुअल मेमोरी बनाम भौतिक मेमोरी: किन यो फरक पर्दैन

विभिन्न आवंटकहरूले पहिलो आवंटनलाई कसरी ह्यान्डल गर्छन्

प्रारम्भिक आवंटन व्यवहार ट्यून गर्दै

यसले हामीलाई सिस्टम प्रोग्रामिङको बारेमा के सिकाउँछ

आज नै आफ्नो व्यापार ओएस बनाउनुहोस्

Try Mewayz Free

Start managing your business smarter today

Ready to put this into practice?

Related articles

Start your free Mewayz trial today

Try Mewayz — Live

Wait — don't leave empty-handed!

Check your inbox!

किन पहिलो C++ (m) आवंटन सधैं 72 KB हुन्छ?

तपाईँको पहिलो C++ आवंटन पछाडिको रहस्य

तपाईंले नयाँ

72 KB विच्छेदन: जहाँ बाइटहरू जान्छन्

एरेना प्रणाली र किन पूर्व-विनियोजन स्मार्ट छ

भर्चुअल मेमोरी बनाम भौतिक मेमोरी: किन यो फरक पर्दैन

विभिन्न आवंटकहरूले पहिलो आवंटनलाई कसरी ह्यान्डल गर्छन्

प्रारम्भिक आवंटन व्यवहार ट्यून गर्दै

यसले हामीलाई सिस्टम प्रोग्रामिङको बारेमा के सिकाउँछ

आज नै आफ्नो व्यापार ओएस बनाउनुहोस्

Try Mewayz Free

Start managing your business smarter today

Ready to put this into practice?

Related articles

Start your free Mewayz trial today

Change Language

Contact Us

Wait — don't leave empty-handed!

Check your inbox!