স্ট্রিং ও ক্যারেকটার টাইপ ভ্যারিয়েবল

ভুমিকাঃ অ্যাপলের নতুন প্রোগ্রামিং ল্যাঙ্গুয়েজ সুইফ্ট নিয়ে লেখা আমাদের তৃতীয় সেকশনের প্রথম অধ্যায়ে সুইফ্ট সম্পর্কে পরিচিতি মুলক আলোচনা হয়েছে। আমরা সুইফ্ট ল্যাঙ্গুয়েজের বেসিক সিনট্যাক্স, ভ্যারিয়েবল ও কনস্ট্যান্ট ডিক্লেয়ার করা, বিভিন্ন ধরনের অপারেটর সম্পর্কে জেনেছি। এই অধ্যায়ে ক্যারেকটার ও স্ট্রিং ম্যানিপুলেশনের বিস্তারিত থাকবে।

ক্যারেকটার ও স্ট্রিং ঃ অন্যান্য বেসিক ডাটাটাইপ (Integer, Float, Double) গুলোর মতই ক্যারেকটার (Character) একটি ডাটাটাইপ যা এক বাইট (Byte) ডাটা সংরক্ষন করে। অন্যদিকে ক্যারেকটার টাইপ অ্যারে কে স্ট্রিং(String) বলা হয়। অর্থাৎ যদি একাধিক ক্যারেকটার একত্রে কোন নির্দিষ্ট নিয়মে সাজানো হয় তাহলে এই ক্যারেকটারগুলোকে একত্রে একটি স্ট্রিং বলা হয়। যেমন ঃ "Steve Jobs", "Swift", "Programming", "Macbook Pro and My IPhone" ইত্যাদি। অনেকসময় একটি ক্যারেকটার কে ও স্ট্রিং হিসেবে ব্যবহার করা যায় যার উদাহরন আমরা একটু পরেই দেখব।

অন্যান্য প্রোগ্রামিং ল্যাঙ্গুয়েজের চেয়ে সুইফ্ট এ স্ট্রিং ও ক্যারেকটার ম্যানিপুলেট করা অনেক বেশী ফাস্টার এবং সুইফ্ট ক্যারেকটার গুলোতে ইউনিকোড ক্যারেকটার স্টোর করে। অর্থাৎ যেকোন ক্যারেকটারে ভ্যালু হিসেবে ইউনিকোড স্টোর করা যায় যা এনকোডিং ডিকোডিং এর ঝামেলা কমিয়ে দিয়েছে। এছাড়া সুইফ্ট ল্যাঙ্গুয়েজে স্ট্রিং ম্যানিপুলেশন খুবই সহজ। খুব সহজেই যেকোন স্ট্রিং এর কোন ইনডেক্সে কনস্ট্যান্ট, ক্যারেকটার, নাম্বার, এক্সপ্রেশন ইত্যাদি ইনসার্ট করা যায়। এভাবে স্ট্রিং এর মধ্যে কোন কিছু ইনসার্ট করাকে ইন্টারপুলেশন বলা হয়।

স্ট্রিং ডিক্লেয়ার করাঃ কিভাবে ভ্যারিয়েবল ও কনস্ট্যান্ট ডিক্লেয়ার করতে হয় তা আমরা প্রথম অধ্যায়ে শিখেছি। একই ভাবে স্ট্রিং টাইপ ভ্যারিয়েবল বা কনস্ট্যান্ট ডিক্লেয়ার করতে হয়।

let stringVariable = "যেকোন ইউনিকোড সাপোর্টেড ক্যারেকটারসমুহ"
let anotherStringVariable: String = "Yosemite is the name of latest OS X"

যেহেতু stringVariable ও anotherStringVariable দুটিতে স্ট্রিং দিয়ে ইনিশিয়ালাইজ করা হয়েছে তাই এই কনস্ট্যান্ট দুটি এখন স্ট্রিং টাইপ কনস্ট্যান্ট হিসেবে কাজ করবে। এবং এদের উপর যাবতীয় স্ট্রিং অপারেশনগুলো করা যাবে।

স্ট্রিং এ ক্যারেকটার ছাড়াও অন্যান্য যা যা থাকতে পারে ঃ

সব ধরনের স্পেশাল (escaped special) ক্যারেকটার যেমন ঃ \০ ( null ), \n (new line), \\ (backslash), \t (horizontal tab), \" (double quote), \' (single quote) ইত্যাদি।

এক বাইটের ইউনিকোড স্কেলার (\xnn, nn এর জায়গায় যেকোন দুটি হেক্সাডেসিমেল ডিজিট বসতে পারে)

দুই বাইটের ইউনিকোড স্কেলার (\xnnnn, nnnn এর জায়গায় যেকোন চারটি হেক্সাডেসিমেল ডিজিট বসতে পারে)

চার বাইটের ইউনিকোড স্কেলার (\xnnnnnnnn, nnnnnnnn এর জায়গায় যেকোন আটটি হেক্সাডেসিমেল ডিজিট বসতে পারে)

let wiseWords = "\"Imagination is more important than knowledge\" - Einstein"
// "Imagination is more important than knowledge" - Einstein
let dollarSign = "\x24"        // $,  Two Byte Unicode scalar U+0024
let blackHeart = "\u2665"      // ♥,  Four Byte Unicode scalar U+2665
let sparklingHeart = "\U0001F496"  // 💖, Eight Byte Unicode scalar U+1F496

ফাঁকা স্ট্রিং ইনিশিয়ালাইজ করাঃ সাধারনত প্রোগ্রামের শুরুতে ফাঁকা স্ট্রিং ইনিশিয়ালাইজ করা হয় যা পরবর্তীতে বিভিন্ন সময়ে বিভিন্ন অপারেশনের মাধ্যমে বড় সাইজের ক্যারেকটারের কালেকশন হয়ে কোন অর্থ বা তথ্য বহন করে। দুইভাবে এরকম ফাঁকা স্ট্রিং ইনিশিয়ালাইজ করা যায়। ভ্যারিয়েবল বা কনস্ট্যান্টে সরাসরি কোন ফাঁকা স্ট্রিং অ্যাসাইন করে অথবা String টাইপের নতুন ইনস্ট্যান্স ইনিশিয়ালাইজ করে ফাঁকা স্ট্রিং ইনিশিয়ালাইজ করা হয়। নিচে দুই ধরনের পদ্ধতির উদাহরন দেওয়া হলঃ

var ফাঁকাস্ট্রিং = ""               // empty string literal
var emptyString = ""
var anotherEmptyString = String()  // initialiser syntax
// these three strings are all empty, and are equivalent to each other

প্রয়োজনে খুব সহজেই isEmpty প্রোপার্টির বুলিয়ান ভ্যালু দেখে কোন স্ট্রিং ফাঁকা কিনা তা চেক করা যায়।

var emptyString = ""
if emptyString.isEmpty {
    println("Nothing to see here")
}
// prints "Nothing to see here"

স্ট্রিং মিউট্যাবিলিটি (String Mutability) ঃ কোন স্ট্রিং মিউট্যাবল( Mutable or Modifiable) হবে কিনা তা নির্ধারিত হয় ভ্যারিয়েবল বা কনস্ট্যান্ট ডিক্লেয়ার করার সময়। যদি স্ট্রিংটি "var" টাইপ দিয়ে ডিক্লেয়ার করা হয় তাহলে এটিকে মডিফাই করা যাবে। কিন্তু যদি এই স্ট্রিংটি "let" টাইপ হয় তাহলে এটি একটি কনস্ট্যান্ট এর ন্যায় আচরন করবে। তাই "let" টাইপ স্ট্রিং মিউট্যাবল না। নিচের উদাহরন টি দেখলেই পরিস্কার হয়ে যাবে ব্যাপার টি।

var variableString = "Swift is"
variableString += " a new programming language."
// variableString is now "Swift is a new programming language."

let constantString = "Swift is very much"
constantString += " faster and interactive"
// this reports a compile-time error - a constant string cannot be modified

নোটঃ সুইফ্ট (Swift) এর এই স্ট্রিং এর সাথে অবজেকটিভ-সি (Objective-C) এর NSString রয়েছে ব্রিজ কানেকশন। আমরা যদি Cocoa অথবা Cocoa Touch এর Foundation ক্লাস নিয়ে কাজ করি তাহলে সুইফ্ট এর স্ট্রিং টাইপ ভ্যারিয়েবলগুলোর জন্য NSString ক্লাসের সব এপিআই (API) কল করা যায়।

Cocoa বা Cocoa Touch এর Foundation ক্লাসের NSString এর ইনস্ট্যান্স তৈরী করে যদি ফাংশন বা মেথডে পাঠানো হয় তাহলে মুলত ওই স্ট্রিং এর রেফারেন্স বা পয়েন্টারকেই পাঠানো হয় যা নতুন পয়েন্টার বা রেফারেন্সে অ্যাসাইন করা হয়। আসল স্ট্রিং এর কোন কপি তৈরী হয় না। অন্যদিকে Swift এর String ভ্যালু তৈরী করে যদি কোন ভ্যারিয়েবলে অ্যাসাইন করা হয় অথবা কোন মেথড বা ফাংশনে পাঠানো তাহলে প্রথমে ওই স্ট্রিং এর একটি কপি তৈরী হয় এবং তারপর এই নতুন স্ট্রিং টি মেথডে পাঠানো হয় অথবা নতুন ভ্যারিয়েবলে অ্যাসাইন করা হয়। আমাদের কাগুজে বইতে এই সম্পর্কে আরও বিস্তারিত থাকবে।

ক্যারেকটার ম্যানিপুলেশনঃ এতক্ষনে আমরা জেনে গেছি যে, স্ট্রিং আসলে একত্রে থাকা অনেকগুলো Character যা সুইফ্ট এ String টাইপ দিয়ে রিপ্রেজেন্ট করা হয়। প্রত্যেকটি Character আবার একটি ইউনিকোড ক্যারেকটার। সুইফ্টে for-in লুপ দিয়ে একটি স্ট্রিং এর প্রত্যেকটি ক্যারেকটার এক্সেস করা যায়। for-in লুপ এর সিনট্যাক্স ও বিস্তারিত পরের অধ্যায়ে থাকবে। এই মুহুর্তে আমরা একটি স্ট্রিং এর প্রথম থেকে শেষ পর্যন্ত সবগুলা Character এক্সেস করব এবং তা দেখব।

for ch in "Macintosh" {
    println(ch)
}
// M
// a
// c
// i
// n
// t
// o
// s
// h

আবার কোন এক ক্যারেকটারের স্ট্রিং থেকে Character টাইপ ভ্যারিয়েবল বা কনস্ট্যান্ট ডিক্লেয়ার করার জন্য নিচের মত কোড লিখতে হয়।

let charConstant: Character = "$"
var charVariable: Character = "ক"

স্ট্রিং এ থাকা মোট ক্যারেকটারের সংখ্যা জানাঃ countElements() একটি গ্লোবাল মেথড যা আর্গুমেন্ট হিসেবে একটি স্ট্রিং নেয় এবং এই স্ট্রিং এ কয়টি ক্যারেকটার আছে তা রিটার্ন করে।

let intro: String = "In Swift, It is too easy to count characters."
var countChar = countElements(intro);
println(countChar)  // 45

নোটঃ সুইফ্ট এর স্ট্রিং এর ক্যারেকটারগুলো ইউনিকোড ক্যারেকটার হয় এবং ইউনিকোডে বিভিন্ন ক্যারেকটারের সাইজ ও আলাদা হয়। একারনে সুইফ্ট ল্যাঙ্গুয়েজে সকল ক্যারেকটার একই সাইজের মেমরী নেয় না। তাই countElements() মেথডের রিটার্ন ভ্যালু ও আমাদের চাওয়া অনুযায়ী হয় না। তাই কোন স্ট্রিং এ ক্যারেকটারের সঠিক সংখ্যা জানার জন্য লুপ ব্যবহার করে প্রত্যেকটি ক্যারেকটার গননা করতে হয়। নিচের উদাহরনটিতে প্রথম লাইনে counter ভ্যারিয়েবল ০ দিয়ে ইনিশিয়ালাইজ করা হয়েছে। এরপর for-in লুপ দিয়ে প্রথম থেকে শেষ পর্যন্ত প্রত্যেকটি ক্যারেকটার ভিজিট করা হয় এবং প্রতিবার counter এর ভ্যালু ১ করে বাড়ানো হয়। ফলে for-in টির এক্সিকিউশন শেষ হলে counter ভ্যারিয়েবলে "Macintosh" এর মোট ক্যারেকটারের সংখ্যা পাওয়া যাবে।

var counter = 0
for ch in "Macintosh" {
    counter++;
}
println("This string has \(counter) characters"); // This string has 9 characters

স্ট্রিং এবং ক্যারেকটার কনক্যাট (Concate) করা ঃ স্ট্রিং ও ক্যারেকটার টাইপ ভ্যারিয়েবল বা কনস্ট্যান্ট একত্রে যুক্ত (Concatenation) করে নতুন স্ট্রিং ইনিশিয়ালাইজ করা যায়। আবার কোন স্ট্রিং এর সাথে ক্যারেকটার যুক্ত (Concate) করে স্ট্রিং টিকে মডিফাই (Modify) করা যায়। নিচের উদাহরন গুলো দেখলেই ব্যপারগুলো বোঝা যাবে।

//Example 1
let string1 = "hello"
let string2 = " Steve"
let character1: Character = "!"
let character2: Character = "?"

let stringPlusCharacter = string1 + character1        // equals "hello!"
let stringPlusString = string1 + string2              // equals "hello Steve"
let characterPlusString = character1 + string1        // equals "!hello"
let characterPlusCharacter = character1 + character2  // equals "!?"

//Example 2
var instruction = "follow"
instruction += string2
// instruction now equals "follow Steve"

var welcome = "good morning"
welcome += character1
// welcome now equals "good morning!"

স্ট্রিং ইন্টারপুলেশন (String Interpolation)ঃ কোন স্ট্রিং এর মধ্যে নতুন করে কোন কনস্ট্যান্ট, ভ্যারিয়েবল, এক্সপ্রেশন ইত্যাদির মিশিয়ে নতুন কোন স্ট্রিং তৈরী করা কে বলা হয় স্ট্রিং ইন্টারপুলেশন। এজন্য যে নতুন ভ্যারিয়েবল বা কনস্ট্যান্ট বা এক্সপ্রেশন মেশানো হবে তা প্যারেনথেসিস বা "()" এর ভিতর লিখে তার আগে একটি ব্যাকস্ল্যাশ দিতে হয়। তাহলে স্ট্রিং এই অংশে নতুন জিনিস টি ইনসার্ট হয়ে যায়।

let multiplier = 3
let message = "\(multiplier) times 2.5 is \(Double(multiplier) * 2.5)"
// message is "3 times 2.5 is 7.5"

উপরের কোডটিতে multiplier কনস্ট্যান্টটি ২ বার ব্যবহার করে একটি নতুন স্ট্রিং message তৈরী করা হয়েছে। এজন্য যেসব পজিশনে multiplier এর ভ্যালু ইনসার্ট করা হবে সেসব স্থানে প্রথমে ব্যাকস্ল্যাশ ও তারপর প্যারেনথেসিস দিয়ে multiplier লেখা হয়েছে। ইন্টারপুলেশনের সময় "(multiplier)" এর পরিবর্তে এখানে multiplier এর ভ্যালু তথা 3 বসবে। এখানে লক্ষ্য করার বিষয় হল প্রথম multiplier টি একটি কনস্ট্যান্ট যা সরাসরি স্ট্রিং টিতে ইনসার্ট করা হয়েছে। কিন্তু ২য় টিতে একটি এক্সপ্রেশন "Double(multiplier) * 2.5" ইনসার্ট করা হয়েছে। প্রথমে multiplier এর ভ্যালু Double দিয়ে কাস্ট (Cast) করে তারপর 2.5 দিয়ে গুন করার পর যে রেসাল্ট পাওয়া যাবে তাই ইনসার্ট করা হয়েছে স্ট্রিং টিতে।

স্ট্রিং কমপ্যারিজন (String Comparison)ঃ সুইফ্ট (Swift) এর String টাইপের মধ্যকার কমপ্যারিজন করার জন্য ৩টি মেথড রয়েছে : স্ট্রিং(String) ইকুয়্যালিটি, প্রিফিক্স(Prefix) ইকুয়্যালিটি এবং সাফিক্স(Suffix) ইকুয়্যালিটি।

২ টি স্ট্রিং ইকুয়্যাল হবে যদি এবং কেবল যদি উভয় স্ট্রি এর ক্যারেকটারগুলো একই হয় এবং একই অর্ডারে থাকে। এক্ষেত্রে মনে রাখতে হবে বড় হাতের অক্ষর আর ছোট হাতের অক্ষরের ইউনিকোড আলাদা হওয়ায় ক্যারেকটার হিসেবেও এরা আলাদা হবে।

let quotation = "We're a lot alike, you and I."
let sameQuotation = "We're a lot alike, you and I."
if quotation == sameQuotation {
    println("These two strings are considered equal")
}
// prints "These two strings are considered equal"

স্ট্রিং টিতে কোন পার্টিকুলার (particular) স্ট্রিং প্রিফিক্স বা সাফিক্স আছে কিনা তা চেক করার জন্য রয়েছে hasPrefix বা hasSuffix মেথড। উভয় মেথড স্ট্রিং টাইপ আর্গুমেন্ট নিয়ে বুলিয়ান ভ্যালু রিটার্ন করে। আর্গুমেন্টের প্রত্যেকটি ক্যারেকটার মুল স্ট্রিং এ একই অর্ডারে আছে কিনা সেটাই চেক করে মেথড দুটি।

let comment = "Swift is a awesome language."
if comment.hasPrefix("Swift"){
   // String comment contains a "Swift" as prefix
}

if comment.hasSuffix("language."){
   // String comment contains a "language." as Suffix
}

উপরের উদাহরনটিতে comment একটি স্ট্রিং টাইপ কনস্ট্যান্ট নেওয়া হয়েছে। hasPrefix("Swift") মেথড টি মুলত comment স্ট্রিং এর প্রথমে "Swift" স্ট্রিং টি আছে কিনা। যেহেতু comment স্ট্রিং টিতে প্রিফিক্স হিসেবে "Swift" আছে তাই মেথডটি TRUE রিটার্ন করে। আবার hasSuffix("language.") মেথডটি এটাই চেক করছে যে comment স্ট্রিং টি "language." দিয়ে শেষ হয়েছে কিনা। যেহেতু স্ট্রিং টির শেষ "language." দিয়ে হয়েছে তাই মেথড টি TRUE রিটার্ন করে।

কেস(Case) কনভারসনঃ স্ট্রিং ম্যানিপুলেশনের একটি কমন টাস্ক হল কেস কনভারসন। অর্থাৎ ছোট হাতের অক্ষর থেকে বড় হাতের অক্ষর বা বড় হাতের অক্ষর থেকে ছোট হাতের অক্ষরে রুপান্তর করা। সুইফ্টে এই কাজ যথেষ্ট সহজেই করা যায়।

let normal = "Would you mind giving me a glass of Water?"
let uppercase = normal.uppercaseString
// uppercase is equal to "WOULD YOU MIND GIVING ME A GLASS OF WATER?"
let lowercase = normal.lowercaseString
// lowercase is equal to "would you mind giving me a glass of water?"

পরিসমাপ্তিঃ নিশ্চয়ই খেয়াল করেছেন যে আমরা বার বার ইউনিকোড শব্দটি উচ্চারন করছি। স্ট্রিং ও ক্যারেকটার হ্যান্ডলিং এর জন্য সুইফ্টের রয়েছে কিছু বিশেষ মেথড যা দিয়ে সহজেই স্ট্রিং ও ক্যারেকটারের ইউনিকোড রিপ্রেজেন্টেশন ম্যানিপুলেশন করা যায়। এসম্পর্কে বিস্তারিত আমাদের কাগুজে বইতে পাওয়া যাবে।

বইয়ের আপডেট পেতে চোখ রাখুন আমাদের ফ্যান পেজে

পরের চাপ্টারঃ পরের চাপ্টারে Collections তথা Arrays ও Dictionaries নিয়ে বিস্তারিত থাকবে। এছাড়াও থাকবে Enumerations ও Closures নিয়ে অল্প বিস্তর আলোচনা।

Originally Posted Here

Last updated