Microsoft Excel दिन-प्रतिदिन के कार्यों में उत्कृष्ट है। लेकिन अब और फिर, आप इसकी कमियों में से एक का सामना करते हैं: एक स्प्रेडशीट का आकार। एक्सेल स्प्रेडशीट को छोटा बनाने या एक बड़ी CSV फ़ाइल को कई फ़ाइलों में विभाजित करने का तरीका जानने के लिए पढ़ें।
क्यों कई फ़ाइलों में एक बड़े CSV विभाजित?
आप सोच रहे होंगे, "मुझे बड़ी एक्सेल फाइल को कई छोटी फाइलों में विभाजित करने की आवश्यकता क्यों होगी?" यह एक दिलचस्प सवाल है, विशेष रूप से एक्सेल में 1,048,576 की एक स्प्रेडशीट पंक्ति की सीमा है।
1 मिलियन से अधिक पंक्तियाँ अभूतपूर्व लगती हैं। हालाँकि, पंक्ति सीमा को मारना आपके विचार से आसान है, खासकर कुछ कार्यों के दौरान।
उदाहरण के लिए, यदि आप ईमेल के माध्यम से मार्केटिंग कर रहे हैं, तो आप लाखों ईमेल पतों वाली CSV फ़ाइल आयात कर सकते हैं। एकमात्र समस्या यह है कि आप उस पते के साथ एक स्प्रेडशीट कैसे प्रबंधित करते हैं? इसके अलावा, क्या होगा यदि कोई आपको एक सीएसवी भेजता है जो पहले से ही सीमा पर है (दूसरे कार्यक्रम से)?
यदि वह समस्या आपको किसी समस्या की तरह लगती है, तो एक बड़े CSV या Excel फ़ाइल को कई छोटी फ़ाइलों में विभाजित करने के लिए निम्नलिखित पाँच तरीकों की जाँच करें।
एक बड़ी CSV फ़ाइल नहीं है, लेकिन घर पर खेलना चाहते हैं? मैं उदाहरणों में COVID-19 ओपन रिसर्च डेटासेट का उपयोग कर रहा हूं, जिसे आप डाउनलोड कर सकते हैं और उपयोग भी कर सकते हैं।
एक कार्यक्रम का उपयोग कर CSV फ़ाइलें तोड़ें
वहाँ कई उपयोगी सीएसवी फाड़नेवाला कार्यक्रम वहाँ से बाहर हैं। यहाँ दो सबसे अच्छे हैं। निष्पक्ष चेतावनी हालांकि, इन कार्यक्रमों में काम कर रहे हैं के रूप में वे कभी-कभी स्मृति मुद्दों में भाग लेते हैं, जो सीएसवी-विभाजन कार्यक्रमों के लिए एक आम समस्या है।
नि: शुल्क विशाल सीएसवी फाड़नेवाला

फ्री विशाल सीएसवी स्प्लिटर एक बुनियादी सीएसवी विभाजन उपकरण है। आप उस CSV फ़ाइल को इनपुट करते हैं जिसे आप विभाजित करना चाहते हैं, वह पंक्ति जिसे आप चाहते हैं, और फिर स्प्लिट फ़ाइल का चयन करें । पंक्ति गणना आपके द्वारा समाप्त होने वाली आउटपुट फ़ाइलों की संख्या निर्धारित करती है।
CSV फाड़नेवाला

CSV स्प्लिटर दूसरा उपकरण है। यह नि: शुल्क विशाल CSV फाड़नेवाला के रूप में एक ही कार्यक्षमता प्रदान करता है, थोड़ा चिकना डिजाइन के साथ यद्यपि। यह आपके CSV को तेजी से छोटे टुकड़ों में विभाजित करता है, जिससे आप उस लाइन की गणना निर्धारित कर सकते हैं जिसका आप चाहते हैं।
2. एक बैच फ़ाइल का उपयोग करें
अगला, एक प्रोग्राम करने योग्य बैच फ़ाइल बनाएँ । आप CSV को छोटे विखंडू में संसाधित करने के लिए एक बैच फ़ाइल का उपयोग कर सकते हैं, अलग-अलग विखंडू को वितरित करने के लिए फ़ाइल को अनुकूलित कर सकते हैं।
एक नया टेक्स्ट डॉक्यूमेंट खोलें, फिर निम्नलिखित को कॉपी और पेस्ट करें:
@echo off
setlocal ENABLEDELAYEDEXPANSION
REM Edit this value to change the name of the file that needs splitting. Include the extension.
SET BFN=HCAHPSHospital.csv
REM Edit this value to change the number of lines per file.
SET LPF=2500
REM Edit this value to change the name of each short file. It will be followed by a number indicating where it is in the list.
SET SFN=HosptialSplitFile
REM Do not change beyond this line.
SET SFX=%BFN:~-3%
SET /A LineNum=0
SET /A FileNum=1
For /F "delims==" %%l in (%BFN%) Do (
SET /A LineNum+=1
echo %%l >> %SFN%!FileNum!.%SFX%
if !LineNum! EQU !LPF! (
SET /A LineNum=0
SET /A FileNum+=1
)
)
endlocal
Pause
आपको चलने से पहले बैच फ़ाइल को कॉन्फ़िगर करना होगा। मैं आपको बताता हूं कि प्रत्येक कमांड क्या करता है, और आप इसे अपने बैच फ़ाइल के आकार और साथ ही आवश्यक आउटपुट के अनुसार बदल सकते हैं।
- "सेट बीएफएन =" सीएसवी को इंगित करना चाहिए जिसे आपको तोड़ने की आवश्यकता है
- " SET LPF =" आपकी नई फ़ाइल को सीमित करने के लिए पंक्तियों की संख्या है
- "SET SFN =" आपकी विभाजन फ़ाइलों के लिए नई नामकरण योजना है
एक बार जब आप अपने चर में प्रवेश कर जाते हैं, तो फ़ाइल> इस रूप में सहेजें । फ़ाइल नाम चुनें, और सहेजें चुनें। फिर, अपनी नई सहेजी गई टेक्स्ट फ़ाइल का चयन करें और इसे पुनः नाम बदलने के लिए F2 दबाएं। .Bxt एक्सटेंशन को .bat से बदलें और चेतावनी दिखाई देने पर ओके दबाएं। अब, आप अपनी बड़ी CSV फ़ाइल को छोटी आउटपुट फ़ाइलों में विभाजित कर सकते हैं।
3. एक CSV फ़ाइल को तोड़ने के लिए एक PowerShell स्क्रिप्ट का उपयोग करें
आप दिन-प्रतिदिन के कार्यों की एक विस्तृत श्रृंखला के लिए बैच फ़ाइलों का उपयोग कर सकते हैं । लेकिन PowerShell स्क्रिप्ट तेज़ हैं, विशेष रूप से इस प्रकार के प्रसंस्करण और विभाजन के लिए।
निम्न स्क्रिप्ट जल्दी से आपके बड़े CSV को छोटी फ़ाइलों में काट देती है।
Windows Power Menu खोलने के लिए सबसे पहले CTRL + X दबाएँ , फिर PowerShell का चयन करें। यदि PowerShell कोई विकल्प नहीं है, तो अपने प्रारंभ मेनू खोज बार में इनपुट शक्तियां प्राप्त करें और सर्वश्रेष्ठ मिलान का चयन करें।
अब, निम्न स्क्रिप्ट को कॉपी और पेस्ट करें:
$InputFilename = Get-Content 'C:filelocation'
$OutputFilenamePattern = 'output_done_'
$LineLimit = 50000
$line = 0
$i = 0
$file = 0
$start = 0
while ($line -le $InputFilename.Length) {
if ($i -eq $LineLimit -Or $line -eq $InputFilename.Length) {
$file++
$Filename = "$OutputFilenamePattern$file.csv"
$InputFilename[$start..($line-1)] | Out-File $Filename -Force
$start = $line;
$i = 0
Write-Host "$Filename"
}
$i++;
$line++
}
अपनी CSV फ़ाइल के साथ पहली पंक्ति में फ़ाइल स्थान बदलें, फिर स्क्रिप्ट चलाएँ। स्क्रिप्ट आपकी उपयोगकर्ता निर्देशिका में छोटी CSV फ़ाइलों को आउटपुट करती है। उदाहरण के लिए, मेरी CSV फाइलें C: Users Gavin में फ़ाइल नाम output_done_1.csv के साथ पाई जाती हैं । आप $ OutputFilenamePattern = 'output_done_' लाइन को बदलकर आउटपुट नाम बदल सकते हैं।

आप मूल स्क्रिप्ट SPJeff पर पा सकते हैं।
4. पावर पिवट का उपयोग करके एक बड़े CSV को तोड़ें
एक बड़ी CSV फ़ाइल को छोटे बिट्स में तोड़ने के लिए आपका दंडात्मक समाधान वास्तव में इसे तोड़ नहीं सकता है। इसके बजाय, यह आपको अपने बड़े पैमाने पर CSV फ़ाइल को Excel में लोड करने देता है और इसे खोलने के लिए Power Pivot टूल का उपयोग करता है। ये सही है; आप एक्सेल लाइन की सीमा को प्रभावी ढंग से अनदेखा कर सकते हैं और कार्यक्रम के भीतर फाइल का प्रबंधन कर सकते हैं।

आप CSV फ़ाइल के लिए डेटा लिंक बनाकर इसे प्राप्त करते हैं, फिर सामग्री को प्रबंधित करने के लिए Power Pivot का उपयोग करते हैं। एक पूर्ण स्पष्टीकरण और ट्यूटोरियल के लिए, जोस बैरेटो के ब्लॉग को इस प्रक्रिया का विवरण देते हुए पढ़ें।
संक्षेप में, बैरेटो एक पिवट टेबल बनाता है, जिसमें "8.5 मिलियन पंक्तियों तक कोई समस्या नहीं है।" उपरोक्त छवि ब्लॉग पोस्ट से आती है, जिसमें एक्सेल के उपयोग में कुल 2 मिलियन पंक्तियाँ दिखाई देती हैं।
याद रखें, यह प्रक्रिया CSV को छोटे टुकड़ों में विभाजित नहीं करती है। हालांकि, इसका मतलब है कि आप एक्सेल में सीएसवी को हेरफेर कर सकते हैं, जो एक बहुत ही आसान विकल्प है। यदि आपको अधिक युक्तियों की आवश्यकता है, तो डेटा विश्लेषण के लिए धुरी तालिका का उपयोग करने का तरीका जानें ।
5. विभाजित CSV का उपयोग करके बड़े CSV ऑनलाइन को तोड़ें
ऑनलाइन सेवाएँ भी हैं जो आपकी बड़ी CSV फ़ाइल को छोटे बिट्स में तोड़ती हैं। ऐसा ही एक विकल्प स्प्लिट सीएसवी है , एक मुफ्त ऑनलाइन सीएसवी फाड़नेवाला।

स्प्लिट CSV ने COVID-19 डेटासेट को ठीक से प्रबंधित किया, इसे आसान विखंडू में विभाजित किया। अन्य टूल की तरह, आप प्रत्येक फ़ाइल के लिए लाइन काउंट को परिभाषित करते हैं और इसे विभाजित करते हैं। हालाँकि, मेरे पास परीक्षण करने के लिए एक बड़ी CSV फ़ाइल नहीं थी, और, इस तरह, आपका अनुभव भिन्न हो सकता है।
स्प्लिट CSV में प्रीमियम विकल्प भी शामिल हैं। सदस्यता शुल्क के लिए, आप एक कस्टम सीमांकक का उपयोग कर सकते हैं , आउटपुट फ़ाइल प्रकारों का चयन कर सकते हैं , आउटपुट फ़ाइलों से कुछ वर्ण हटा सकते हैं और डुप्लिकेट लाइनें हटा सकते हैं।
आसानी से प्रबंधनीय विखंडू में अपनी CSV फ़ाइलों को तोड़ें
अब आपके पास अपनी CSV फ़ाइलों को छोटे बिट्स में तोड़ने के पाँच उपाय हैं, जिससे उन्हें प्रबंधित करना आसान हो जाता है। समाधान गति और CSV फ़ाइलों के आकार में भिन्न हो सकते हैं जिन्हें वे प्रबंधित कर सकते हैं, इसलिए आपको उस समाधान को खोजने के लिए प्रयोग करना पड़ सकता है जो आपके लिए सबसे अच्छा काम करता है।
छवि श्रेय: lucadp / Depositphotos