স্ট্রিং ও ক্যারেকটার টাইপ ভ্যারিয়েবল

ভুমিকাঃ অ্যাপলের নতুন প্রোগ্রামিং ল্যাঙ্গুয়েজ সুইফ্ট নিয়ে লেখা আমাদের তৃতীয় সেকশনের প্রথম অধ্যায়ে সুইফ্ট সম্পর্কে পরিচিতি মুলক আলোচনা হয়েছে। আমরা সুইফ্ট ল্যাঙ্গুয়েজের বেসিক সিনট্যাক্স, ভ্যারিয়েবল ও কনস্ট্যান্ট ডিক্লেয়ার করা, বিভিন্ন ধরনের অপারেটর সম্পর্কে জেনেছি। এই অধ্যায়ে ক্যারেকটার ও স্ট্রিং ম্যানিপুলেশনের বিস্তারিত থাকবে।

ক্যারেকটার ও স্ট্রিং ঃ অন্যান্য বেসিক ডাটাটাইপ (Integer, Float, Double) গুলোর মতই ক্যারেকটার (Character) একটি ডাটাটাইপ যা এক বাইট (Byte) ডাটা সংরক্ষন করে। অন্যদিকে ক্যারেকটার টাইপ অ্যারে কে স্ট্রিং(String) বলা হয়। অর্থাৎ যদি একাধিক ক্যারেকটার একত্রে কোন নির্দিষ্ট নিয়মে সাজানো হয় তাহলে এই ক্যারেকটারগুলোকে একত্রে একটি স্ট্রিং বলা হয়। যেমন ঃ "Steve Jobs", "Swift", "Programming", "Macbook Pro and My IPhone" ইত্যাদি। অনেকসময় একটি ক্যারেকটার কে ও স্ট্রিং হিসেবে ব্যবহার করা যায় যার উদাহরন আমরা একটু পরেই দেখব।

অন্যান্য প্রোগ্রামিং ল্যাঙ্গুয়েজের চেয়ে সুইফ্ট এ স্ট্রিং ও ক্যারেকটার ম্যানিপুলেট করা অনেক বেশী ফাস্টার এবং সুইফ্ট ক্যারেকটার গুলোতে ইউনিকোড ক্যারেকটার স্টোর করে। অর্থাৎ যেকোন ক্যারেকটারে ভ্যালু হিসেবে ইউনিকোড স্টোর করা যায় যা এনকোডিং ডিকোডিং এর ঝামেলা কমিয়ে দিয়েছে। এছাড়া সুইফ্ট ল্যাঙ্গুয়েজে স্ট্রিং ম্যানিপুলেশন খুবই সহজ। খুব সহজেই যেকোন স্ট্রিং এর কোন ইনডেক্সে কনস্ট্যান্ট, ক্যারেকটার, নাম্বার, এক্সপ্রেশন ইত্যাদি ইনসার্ট করা যায়। এভাবে স্ট্রিং এর মধ্যে কোন কিছু ইনসার্ট করাকে ইন্টারপুলেশন বলা হয়।

স্ট্রিং ডিক্লেয়ার করাঃ কিভাবে ভ্যারিয়েবল ও কনস্ট্যান্ট ডিক্লেয়ার করতে হয় তা আমরা প্রথম অধ্যায়ে শিখেছি। একই ভাবে স্ট্রিং টাইপ ভ্যারিয়েবল বা কনস্ট্যান্ট ডিক্লেয়ার করতে হয়।

let stringVariable = "যেকোন ইউনিকোড সাপোর্টেড ক্যারেকটারসমুহ"
let anotherStringVariable: String = "Yosemite is the name of latest OS X"

যেহেতু stringVariable ও anotherStringVariable দুটিতে স্ট্রিং দিয়ে ইনিশিয়ালাইজ করা হয়েছে তাই এই কনস্ট্যান্ট দুটি এখন স্ট্রিং টাইপ কনস্ট্যান্ট হিসেবে কাজ করবে। এবং এদের উপর যাবতীয় স্ট্রিং অপারেশনগুলো করা যাবে।

স্ট্রিং এ ক্যারেকটার ছাড়াও অন্যান্য যা যা থাকতে পারে ঃ

সব ধরনের স্পেশাল (escaped special) ক্যারেকটার যেমন ঃ \০ ( null ), \n (new line), \\ (backslash), \t (horizontal tab), \" (double quote), \' (single quote) ইত্যাদি।

এক বাইটের ইউনিকোড স্কেলার (\xnn, nn এর জায়গায় যেকোন দুটি হেক্সাডেসিমেল ডিজিট বসতে পারে)

দুই বাইটের ইউনিকোড স্কেলার (\xnnnn, nnnn এর জায়গায় যেকোন চারটি হেক্সাডেসিমেল ডিজিট বসতে পারে)

চার বাইটের ইউনিকোড স্কেলার (\xnnnnnnnn, nnnnnnnn এর জায়গায় যেকোন আটটি হেক্সাডেসিমেল ডিজিট বসতে পারে)

let wiseWords = "\"Imagination is more important than knowledge\" - Einstein"
// "Imagination is more important than knowledge" - Einstein
let dollarSign = "\x24"        // $,  Two Byte Unicode scalar U+0024
let blackHeart = "\u2665"      // ♥,  Four Byte Unicode scalar U+2665
let sparklingHeart = "\U0001F496"  // 💖, Eight Byte Unicode scalar U+1F496

ফাঁকা স্ট্রিং ইনিশিয়ালাইজ করাঃ সাধারনত প্রোগ্রামের শুরুতে ফাঁকা স্ট্রিং ইনিশিয়ালাইজ করা হয় যা পরবর্তীতে বিভিন্ন সময়ে বিভিন্ন অপারেশনের মাধ্যমে বড় সাইজের ক্যারেকটারের কালেকশন হয়ে কোন অর্থ বা তথ্য বহন করে। দুইভাবে এরকম ফাঁকা স্ট্রিং ইনিশিয়ালাইজ করা যায়। ভ্যারিয়েবল বা কনস্ট্যান্টে সরাসরি কোন ফাঁকা স্ট্রিং অ্যাসাইন করে অথবা String টাইপের নতুন ইনস্ট্যান্স ইনিশিয়ালাইজ করে ফাঁকা স্ট্রিং ইনিশিয়ালাইজ করা হয়। নিচে দুই ধরনের পদ্ধতির উদাহরন দেওয়া হলঃ

প্রয়োজনে খুব সহজেই isEmpty প্রোপার্টির বুলিয়ান ভ্যালু দেখে কোন স্ট্রিং ফাঁকা কিনা তা চেক করা যায়।

স্ট্রিং মিউট্যাবিলিটি (String Mutability) ঃ কোন স্ট্রিং মিউট্যাবল( Mutable or Modifiable) হবে কিনা তা নির্ধারিত হয় ভ্যারিয়েবল বা কনস্ট্যান্ট ডিক্লেয়ার করার সময়। যদি স্ট্রিংটি "var" টাইপ দিয়ে ডিক্লেয়ার করা হয় তাহলে এটিকে মডিফাই করা যাবে। কিন্তু যদি এই স্ট্রিংটি "let" টাইপ হয় তাহলে এটি একটি কনস্ট্যান্ট এর ন্যায় আচরন করবে। তাই "let" টাইপ স্ট্রিং মিউট্যাবল না। নিচের উদাহরন টি দেখলেই পরিস্কার হয়ে যাবে ব্যাপার টি।

নোটঃ সুইফ্ট (Swift) এর এই স্ট্রিং এর সাথে অবজেকটিভ-সি (Objective-C) এর NSString রয়েছে ব্রিজ কানেকশন। আমরা যদি Cocoa অথবা Cocoa Touch এর Foundation ক্লাস নিয়ে কাজ করি তাহলে সুইফ্ট এর স্ট্রিং টাইপ ভ্যারিয়েবলগুলোর জন্য NSString ক্লাসের সব এপিআই (API) কল করা যায়।

Cocoa বা Cocoa Touch এর Foundation ক্লাসের NSString এর ইনস্ট্যান্স তৈরী করে যদি ফাংশন বা মেথডে পাঠানো হয় তাহলে মুলত ওই স্ট্রিং এর রেফারেন্স বা পয়েন্টারকেই পাঠানো হয় যা নতুন পয়েন্টার বা রেফারেন্সে অ্যাসাইন করা হয়। আসল স্ট্রিং এর কোন কপি তৈরী হয় না। অন্যদিকে Swift এর String ভ্যালু তৈরী করে যদি কোন ভ্যারিয়েবলে অ্যাসাইন করা হয় অথবা কোন মেথড বা ফাংশনে পাঠানো তাহলে প্রথমে ওই স্ট্রিং এর একটি কপি তৈরী হয় এবং তারপর এই নতুন স্ট্রিং টি মেথডে পাঠানো হয় অথবা নতুন ভ্যারিয়েবলে অ্যাসাইন করা হয়। আমাদের কাগুজে বইতে এই সম্পর্কে আরও বিস্তারিত থাকবে।

ক্যারেকটার ম্যানিপুলেশনঃ এতক্ষনে আমরা জেনে গেছি যে, স্ট্রিং আসলে একত্রে থাকা অনেকগুলো Character যা সুইফ্ট এ String টাইপ দিয়ে রিপ্রেজেন্ট করা হয়। প্রত্যেকটি Character আবার একটি ইউনিকোড ক্যারেকটার। সুইফ্টে for-in লুপ দিয়ে একটি স্ট্রিং এর প্রত্যেকটি ক্যারেকটার এক্সেস করা যায়। for-in লুপ এর সিনট্যাক্স ও বিস্তারিত পরের অধ্যায়ে থাকবে। এই মুহুর্তে আমরা একটি স্ট্রিং এর প্রথম থেকে শেষ পর্যন্ত সবগুলা Character এক্সেস করব এবং তা দেখব।

আবার কোন এক ক্যারেকটারের স্ট্রিং থেকে Character টাইপ ভ্যারিয়েবল বা কনস্ট্যান্ট ডিক্লেয়ার করার জন্য নিচের মত কোড লিখতে হয়।

স্ট্রিং এ থাকা মোট ক্যারেকটারের সংখ্যা জানাঃ countElements() একটি গ্লোবাল মেথড যা আর্গুমেন্ট হিসেবে একটি স্ট্রিং নেয় এবং এই স্ট্রিং এ কয়টি ক্যারেকটার আছে তা রিটার্ন করে।

নোটঃ সুইফ্ট এর স্ট্রিং এর ক্যারেকটারগুলো ইউনিকোড ক্যারেকটার হয় এবং ইউনিকোডে বিভিন্ন ক্যারেকটারের সাইজ ও আলাদা হয়। একারনে সুইফ্ট ল্যাঙ্গুয়েজে সকল ক্যারেকটার একই সাইজের মেমরী নেয় না। তাই countElements() মেথডের রিটার্ন ভ্যালু ও আমাদের চাওয়া অনুযায়ী হয় না। তাই কোন স্ট্রিং এ ক্যারেকটারের সঠিক সংখ্যা জানার জন্য লুপ ব্যবহার করে প্রত্যেকটি ক্যারেকটার গননা করতে হয়। নিচের উদাহরনটিতে প্রথম লাইনে counter ভ্যারিয়েবল ০ দিয়ে ইনিশিয়ালাইজ করা হয়েছে। এরপর for-in লুপ দিয়ে প্রথম থেকে শেষ পর্যন্ত প্রত্যেকটি ক্যারেকটার ভিজিট করা হয় এবং প্রতিবার counter এর ভ্যালু ১ করে বাড়ানো হয়। ফলে for-in টির এক্সিকিউশন শেষ হলে counter ভ্যারিয়েবলে "Macintosh" এর মোট ক্যারেকটারের সংখ্যা পাওয়া যাবে।

স্ট্রিং এবং ক্যারেকটার কনক্যাট (Concate) করা ঃ স্ট্রিং ও ক্যারেকটার টাইপ ভ্যারিয়েবল বা কনস্ট্যান্ট একত্রে যুক্ত (Concatenation) করে নতুন স্ট্রিং ইনিশিয়ালাইজ করা যায়। আবার কোন স্ট্রিং এর সাথে ক্যারেকটার যুক্ত (Concate) করে স্ট্রিং টিকে মডিফাই (Modify) করা যায়। নিচের উদাহরন গুলো দেখলেই ব্যপারগুলো বোঝা যাবে।

স্ট্রিং ইন্টারপুলেশন (String Interpolation)ঃ কোন স্ট্রিং এর মধ্যে নতুন করে কোন কনস্ট্যান্ট, ভ্যারিয়েবল, এক্সপ্রেশন ইত্যাদির মিশিয়ে নতুন কোন স্ট্রিং তৈরী করা কে বলা হয় স্ট্রিং ইন্টারপুলেশন। এজন্য যে নতুন ভ্যারিয়েবল বা কনস্ট্যান্ট বা এক্সপ্রেশন মেশানো হবে তা প্যারেনথেসিস বা "()" এর ভিতর লিখে তার আগে একটি ব্যাকস্ল্যাশ দিতে হয়। তাহলে স্ট্রিং এই অংশে নতুন জিনিস টি ইনসার্ট হয়ে যায়।

উপরের কোডটিতে multiplier কনস্ট্যান্টটি ২ বার ব্যবহার করে একটি নতুন স্ট্রিং message তৈরী করা হয়েছে। এজন্য যেসব পজিশনে multiplier এর ভ্যালু ইনসার্ট করা হবে সেসব স্থানে প্রথমে ব্যাকস্ল্যাশ ও তারপর প্যারেনথেসিস দিয়ে multiplier লেখা হয়েছে। ইন্টারপুলেশনের সময় "(multiplier)" এর পরিবর্তে এখানে multiplier এর ভ্যালু তথা 3 বসবে। এখানে লক্ষ্য করার বিষয় হল প্রথম multiplier টি একটি কনস্ট্যান্ট যা সরাসরি স্ট্রিং টিতে ইনসার্ট করা হয়েছে। কিন্তু ২য় টিতে একটি এক্সপ্রেশন "Double(multiplier) * 2.5" ইনসার্ট করা হয়েছে। প্রথমে multiplier এর ভ্যালু Double দিয়ে কাস্ট (Cast) করে তারপর 2.5 দিয়ে গুন করার পর যে রেসাল্ট পাওয়া যাবে তাই ইনসার্ট করা হয়েছে স্ট্রিং টিতে।

স্ট্রিং কমপ্যারিজন (String Comparison)ঃ সুইফ্ট (Swift) এর String টাইপের মধ্যকার কমপ্যারিজন করার জন্য ৩টি মেথড রয়েছে : স্ট্রিং(String) ইকুয়্যালিটি, প্রিফিক্স(Prefix) ইকুয়্যালিটি এবং সাফিক্স(Suffix) ইকুয়্যালিটি।

২ টি স্ট্রিং ইকুয়্যাল হবে যদি এবং কেবল যদি উভয় স্ট্রি এর ক্যারেকটারগুলো একই হয় এবং একই অর্ডারে থাকে। এক্ষেত্রে মনে রাখতে হবে বড় হাতের অক্ষর আর ছোট হাতের অক্ষরের ইউনিকোড আলাদা হওয়ায় ক্যারেকটার হিসেবেও এরা আলাদা হবে।

স্ট্রিং টিতে কোন পার্টিকুলার (particular) স্ট্রিং প্রিফিক্স বা সাফিক্স আছে কিনা তা চেক করার জন্য রয়েছে hasPrefix বা hasSuffix মেথড। উভয় মেথড স্ট্রিং টাইপ আর্গুমেন্ট নিয়ে বুলিয়ান ভ্যালু রিটার্ন করে। আর্গুমেন্টের প্রত্যেকটি ক্যারেকটার মুল স্ট্রিং এ একই অর্ডারে আছে কিনা সেটাই চেক করে মেথড দুটি।

উপরের উদাহরনটিতে comment একটি স্ট্রিং টাইপ কনস্ট্যান্ট নেওয়া হয়েছে। hasPrefix("Swift") মেথড টি মুলত comment স্ট্রিং এর প্রথমে "Swift" স্ট্রিং টি আছে কিনা। যেহেতু comment স্ট্রিং টিতে প্রিফিক্স হিসেবে "Swift" আছে তাই মেথডটি TRUE রিটার্ন করে। আবার hasSuffix("language.") মেথডটি এটাই চেক করছে যে comment স্ট্রিং টি "language." দিয়ে শেষ হয়েছে কিনা। যেহেতু স্ট্রিং টির শেষ "language." দিয়ে হয়েছে তাই মেথড টি TRUE রিটার্ন করে।

কেস(Case) কনভারসনঃ স্ট্রিং ম্যানিপুলেশনের একটি কমন টাস্ক হল কেস কনভারসন। অর্থাৎ ছোট হাতের অক্ষর থেকে বড় হাতের অক্ষর বা বড় হাতের অক্ষর থেকে ছোট হাতের অক্ষরে রুপান্তর করা। সুইফ্টে এই কাজ যথেষ্ট সহজেই করা যায়।

পরিসমাপ্তিঃ নিশ্চয়ই খেয়াল করেছেন যে আমরা বার বার ইউনিকোড শব্দটি উচ্চারন করছি। স্ট্রিং ও ক্যারেকটার হ্যান্ডলিং এর জন্য সুইফ্টের রয়েছে কিছু বিশেষ মেথড যা দিয়ে সহজেই স্ট্রিং ও ক্যারেকটারের ইউনিকোড রিপ্রেজেন্টেশন ম্যানিপুলেশন করা যায়। এসম্পর্কে বিস্তারিত আমাদের কাগুজে বইতে পাওয়া যাবে।

বইয়ের আপডেট পেতে চোখ রাখুন আমাদের ফ্যান পেজে

পরের চাপ্টারঃ পরের চাপ্টারে Collections তথা Arrays ও Dictionaries নিয়ে বিস্তারিত থাকবে। এছাড়াও থাকবে Enumerations ও Closures নিয়ে অল্প বিস্তর আলোচনা।

Originally Posted Here

Last updated