Blog Image
  • published date image31/01/2023
  • tag image iconData Science, Big Data

বিগ ডাটা এন্ড ডাটা সায়েন্স

আমরা যারা নেটফ্লিক্স বা ইউটিউব চালাই, আমরা সেখানে আমাদের পছন্দ করা মুভি, সিরিজ বা ভিডিও গুলো দেখে থাকি । পরবর্তীতে দেখা যায় আমাদের ব্যক্তিগত পছন্দ ও রুচি অনুসারেই আবার নতুন নতুন মুভি, সিরিজ বা ভিডিও এর রেকোমেন্ডেশন পাই । আবার দেখা যায় ই-মেইল ব্যবহার এর সময় স্প্যামে অনেক ধরনের মেইল এসে থাকে। ই-মেইল নিজেই আসলে অটোমেটিক্যালি ডিটেক্ট করে নেয়, কোন মেইলগুলো স্পন্সর্ড অথবা কোনগুলো প্রমোশনাল । আরেকটি উদাহরণ দেওয়া যায়, যখন আমরা আমাদের ফোন ব্যবহার করি তখন চ্যাট করার সময় বা কাউকে ম্যাসেজ পাঠানোর সময় যদি আমরা কোনো স্পেলিং ভুল করে থাকি, তখন উপরে সঠিক বানানটি এসে পড়ে । এই যে অটো কারেক্ট বা অটো কম্প্লিটিড এর এই ফিচারগুলো আবার উপরের সবগুলো উদাহরণ ই আসলে ডেটা সাইন্স এর অবদান ।

Forbes-এর একটা জরিপ মতে, ২০৩০ সালের মধ্যে প্রায় ১৩ টি জব সেক্টর পুরোপুরি অটোমেটেড হয়ে যাবে এবং World Economic Forum এর জরিপ থেকে ধারণা করা হয়, অটোমেশনের কারণে প্রায় ৭৫ মিলিয়ন জব রিপ্লেস হয়ে গেলেও মজার বিষয় হলো মোট প্রায় ১৩৩ মিলিয়ন নতুন জব জেনারেট করবে । তবে অটোমেশনের কারণে কিছু নিম্ন ও মধ্যম স্কেলের জব অটোমেটেড করা সম্ভব হলেও কখনোই ডেটা সাইন্সের জব নষ্ট করা সম্ভব নয় ।

তাহলে শুরুতে ডাটা সাইন্স নিয়ে একটু ধারণা নেয়া উচিত । আমি যদি সবথেকে সহজ ভাষায় বলতে চাই, তাহলে ডাটা সাইন্স হলো কয়েকটা বিষয় মিলে হাইব্রিড একটা বিষয় এবং ডাটা সাইন্স যেসব বিষয় কে ফোকাস করে গঠিত সেগুলো হলো - পরিসংখ্যান,ফলিত গণিত এবং কম্পিউটার সাইন্স ।ডেটা নিয়ে কাজ করাই ডেটা সাইন্স এর কাজ। বিগ ডেটা এখন খুব জনপ্রিয় একটা টার্ম। যেখানে ডেটা অনেক বেশি, অনেক অনেক বেশি, সেগুলোকেই বিগ ডেটা বলে। আর ডেটা সংক্রান্ত কাজ যেমনঃ ডেটা এনাইলাইসিস, ম্যানিপুলেশন, ট্রান্সফর্মেশন, ভিজ্যুয়ালাইজেশান যারা করে, তাদেরকে বলে ডেটা সাইন্টিস্ট।

ডেটা সাইন্টিস্ট হওয়ার জন্য দুইটা বিষয় সম্পর্কে ভাল ধারণা থাকতে হয়। একটা হচ্ছে গণিত, আরেকটা হচ্ছে স্ট্যাটিস্টিক্স বা পরিসংখ্যান। এমন না যে আপনাকে এ দুইটা বিষয় এক্সপার্ট হতে হবে ডেটা এনালাইসিস করার জন্য, মোটামুটি ধারণা থাকলেই হবে।

ডেটা গুলো বিভিন্ন ফরমেট txt , csv , SQL , html বা ওয়েব পেইজ ইত্যাদি আকারে থাকে । ডেটা সাইন্টিস্ট হওয়ার জন্য আপনাকে প্রোগ্রামিং এ খুব বেশি দক্ষ হতে হবে না। শুধু প্রোগ্রামিং সম্পর্কে ধারণা থাকলেই হবে।ডেটা এনালাইসিস করার জন্য জনপ্রিয় প্রোগ্রামিং ল্যাঙ্গুয়েজ হচ্ছে R Language. । MATLAB ব্যবহার করে ডেটা এনালাইসিস করা যায়। এছাড়া পাইথনের বিভিন্ন প্যাকেজ রয়েছে। দুইটা জনপ্রিয় প্যাকেজ হচ্ছে NumPy এবং Pandas. এ দুইটা প্যাকেজ ব্যবহার করে সহজেই ডেটা নিয়ে কাজ করা যায়।

Glassdoor এর তথ্য অনুযায়ী আমেরিকায় একজন ডাটা সায়েন্টিস্ট তার অভিজ্ঞতা অনুসারে বছরে প্রায় $95k – $200k স্যালারি নিয়ে থাকেন। ডাটা সায়েন্স এর ওপর ভিত্তি করে যেসব জব পজিশন তৈরি হয়েছে যথাক্রমে – Machine Learning Engineer, Database Administrator, Data Architect, Data Engineer, Business Analyst, Data Analyst, Data Scientist, etc.

তাহলে বাংলাদেশে চাহিদা কেমন? হ্যা, এটা সত্য ডাটা সায়েন্স রিলেভ্যান্ট জবের চাহিদা বাংলাদেশেও অনেক। তবে বাংলাদেশের প্রযুক্তির উন্নয়নের সাথে সাথে এর চাহিদা বেড়েই চলছে এবং ভবিষ্যতে চাহিদা আরও বাড়বে। বাংলাদেশের অনেক প্রাইভেট কোম্পানি তাদের বিজনেস গ্রোথ রেট বৃদ্ধি করার জন্য নতুন নতুন ডাটা সায়েন্স রিলেভ্যান্ট জব নিয়োগ দিচ্ছেন।

 

ইসমাত ফারজানা

পন্ডিত