درخت مبنا (radix tree) یا درخت پاتریشیا (Patricia tree) یا درخت کریت بیت (crit bit tree)، گروهی از داده ساختار های بر پایه ترای هستند که برای نگهداری مجموعه ای از رشته ها استفاده می شوند. برخلاف ترای معمولی، یال ها در درخت مبنا با مجموعه ای از کاراکترها برچسب گذاری می شوند. این برچسب می تواند رشته ای از کاراکترها، مجموعه از بیت ها به عنوان یک عدد صحیح یا یک IP address باشد یا به طور کلی مجموعه ای اختیاری از اشیا به ترتیب نوشتاری. گاهی اوقات اسامی درخت مبنا و درخت کریت بیت فقط به درخت هایی اطلاق میشود که اعداد صحیح را نگه داری می کنند و درخت پاتریشیا، برای ورودیهای کلی تر استفاده میشود اما ساختار آن در همه موارد به همین صورت است.
نگاه کلی
آسان تر است که درخت مبنا را به عنوان یک ترای در نظر بگیریم که از لحاظ حافظه بهینه شده است، چرا که هر گره با یک بچه در درخت مبنا با فرزندش ادغام می شود. نتیجه این میشود که هر گره داخلی حداقل دو بچه دارد. برخلاف ترای معمولی، یالها همون طور که می توانند با یک کاراکتر برچسب گذاری شوند، در این جا می توانند با رشته ای از کاراکترها برچسب گذاری می شوند. این برای مجموعههای کوچک ( به خصوص اگر طول رشتهها زیاد باشد) یا برای مجموعه هایی که رشته هایشان حروف مشترک ابتدایی زیادی داشته باشند، بسیار کارآمدتر است.
این داده ساختار، عملیاتهای اصلی زیر را پشتیبانی میکند و همه آنها از هستند که حداکثر طول یک کلمه در آن گروه از رشته هاست:
مراجعه: تعیین میکند که یک رشته در درخت هست یا نه. این عملیات کاملا همانند درختها انجام میشود با این تفاوت که بعضی یالها ممکن است نشانگر چندین کاراکتر باشند.
درج: اضافه کردن یک رشته به درخت. درخت را تا زمانی که دیگر نتوانیم پیشروی بیشتری داشته باشیم، جستجو می کنیم. در این نقطه ما باید یک یال خروجی که با تمام کاراکترهای باقیمانده از رشته ورودی برچسب گذاری شده، اضافه کنیم. یا اگر از قبل یالی خروجی که در بخشی از حروف با باقیمانده کلمه اشتراک داشته باشد، وجود داشته باشد، آن را به دو یال تقسیم می کنیم( که اولی با بخش مشترک آن، برچسب گذاری می شود) و پیش می رویم. عمل تقسیم تضمین میکند که هیچ گرهی بیشتر از تعداد کاراکترهای رشته ای ممکن، بچه نداشته باشد.
حذف: حذف یک رشته از درخت. ابتدا برگ متناظر را حذف می کنیم. سپس اگر پدر آن فقط یک بچه داشت، پدر را هم حذف کرده و دو یال لازم را با هم ادغام می کنیم.
پیدا کردن جد: بزرگترین رشتهٔ کوچکتر از یک رشتهٔ داده شده را برحسب ترتیب واژه نگاری پیدا می کند.
پیدا کردن جانشین: کوچکترین رشتهٔ بزرگتر از رشتهٔ داده شده را بر حسب ترتیب واژه نگاری پیدا می کند.
یک تعمیم متداول درخت مبنا، از گرههای دورنگی استفاده می کند. سیاه و سفید. برای بررسی اینکه آیا یک رشته در درخت هست یا نه، جستجو از بالا آغاز میشود و یالهای رشته ورودی را تا زمانی که دیگر نتوان جلوتر رفت، دنبال می کند. اگر جستجوی رشته تمام شده باشد و گره نهایی سیاه بوده باشد، جستجو ناموفق بوده است و اگر سفید بود، جستجو موفق. این روش ما را قادر می سازد که با استفاده از گرههای سفید، طیف وسیعی از رشتهها با حروف ابتدایی مشترک را به یک درخت اضافه کنیم. سپس گروه کوچکی از استثنائات را با استفاده از درج آنها با گره سیاه، با یک روش کارآمد از لحاظ فضا، حذف کنیم.
کاربردها
همانطور که ذکر شد، درخت مبنا برای ساخت آرایههای شرکت پذیر با کلید هایی که به صورت رشته بیان می شوند، مفید است. و همچنین کاربرد ویژه ای در حوزه IP Addressها دارد، جایی که توانایی شامل شدن محدوده بزرگی از کلیدها با تعداد کمی استثنا، به طور ویژه ای برای سازماندهی سلسله مراتبی IP Addressها مناسب است. درخت مبنا همچنین در شاخصهای وارونهٔ پروندههای متنی در بازیابی اطلاعات مورد استفاده قرار می گیرد.
تاریخچه
اولین بار دونالد موریسون در 1968 چیزی که خودش درخت پاتریشیا نامید را توصیف کرد. نام آن در واقع مخفف "الگوریتم عملی برای بازیابی اطلاعات کدشده به صورت الفباعددی" ( Practical Algorithm To Retrieve Information Coded In Alphanumeric) می باشد. گرنوت گوهنبرگر در همان زمان به طور مستقل این داده ساختار را طراحی و توصیف کرد.
مقایسه با دیگر داده ساختارها
برخلاف درختهای متوازن، درخت مبنا اجازهٔ مراجعه، درج و حذف را در به نسبت را می دهد. زمانی که این یک برتری به نظر نمی آید اما در یک درخت متوازن، هر مقایسه یک رشته در بدترین حالت زمان نیاز دارد که خیلی از آنها در عمل برای اشتراکات طولانی حروف ابتدایی کند هستند. در یک درخت، همهٔ مقایسهها نیازمند زمان ثابتی است اما درخت مبنا مقایسه برای جستجوی رشته ای به طول نیاز دارد. درختهای مبنا می توانند این عملیاتها را با تعداد مقایسه کمتر و نیازمندی به تعداد گرههای کمتر انجام دهند.
درخت مبنا از مزیتهای درختها نیز بهره می برند. اگرچه آنها می توانند برای رشته ای از عناصر یا عناصری با یک نگاشت (mapping) برگشت پذیر کارآمد به رشتهها به کار روند، اما فاقد عمومیت فوق العادهٔ درختهای متوازن جستجو می باشند که برای هر نوع دادهٔ دارای ترتیب می تواند استفاده شود. یک نگاشت برگشت پذیر به رشته ها، می تواند برای تولید ترتیب موردنیاز برای درخت متوازن جستجو استفاده شود اما نه همه جا. همچنین این می تواند گیج کننده باشد که برای یک نوع داده ای فقط عملیات مقایسه تعریف شده باشد و نه یک ترتیب مشخص.
اغلب گفته میشود که جداول درهم سازی ( Hash tables ) عمل درج و حذف را در انجام می دهند، اما این فقط وقتی درست است که فرض کنیم محاسبهٔ درهم سازی یک کلید، عملیاتی با زمان ثابت است. اگر درهم سازی یک کلید نیز محاسبه شود، جداول درهم سازی عمل درج و حذف را در انجام می دهند که با توجه با شیوه ای که برای حل برخوردها اعمال می شود، در بدترین حالت حتی زمان بیشتری هم می گیرد. درخت مبنا کران بالای اجرای برای درج و حذف دارد. همچنین عملیاتهای یافتن جد و جانشین نیز در جداول درهم سازی پیاده سازی نمی شود.
گونههای دیگر
HAT-trie یک داده ساختار آگاه از حافظه پنهان مبتنی بر درخت مبناست که نگهداری، بازیابی و از سرگیری ترتیبی کارآمدی را برای رشتهها فراهم می کند. اما عملکرد آن با احترام به زمان و حافظه مصرفی آن، قابل مقایسه با جداول درهم سازی بهینه در استفاده از حافظه پنهان است.
باینری و دسیمال و تبدیل آنها به یکدیگر :
می خواستم در مورد IP ها توضیح بدم دیدم احتمالا تو توضیحات به مشکل باینری و دسیمال بر می خوریم
برای همین گفتم همین جا همه چیز رو در مورد این مبنا ها بگم
سعی می کنم ساده توضیح بدم که متوجه بشین، سعس کنید کامل مطالعه کنید تا دیگه با این موضوع مشکل نداشته باشید
دسیمال : یعنی مبنای 10
باینری : یعنی مبنای 2
اکتان : یعنی مبنای 8
هگزا دسیمال : یعنی مبنای 16
وقتی ما از عددی مثل 225 صحبت می کنیم یعنی یک مقدار عددی هست که در مبنای 10 یعنی دسیمال نمایش داده میشه ، اما همین عدید رو اگر بخواهیم به صورت باینری ( مبنای 2 ) نمایش بدیم نتیجه میشه 11100001 به صورت اکتان میشه 341 و به صورت هگزا دسیمال ( مبنای 16 ) میشه E1 ولی همه این مدل نمایش ها در نهایت بیانگر یک عدد هستند که به صورت های مختلف نمایش داده شده اند
که تو حالت عادی ما و روزمره از اعداد در مبنای 10 استفاده می کنیم
ولی در کامپیوتر از مبنای 2 یعنی همون باینری استفاده میشه ، برای همین ما باید بتوانیم مبنای 10 را به 2 تبدیل کنیم
اما روش تبدیل :
روش تبدیل دسیمال به باینری : ( مبنای 10 به مبنای 2 )
فرض کنید می خواهم عدد 253 که دسیمال هست را به باینری تبدیل کنم
برای اینکار باید عدد 253 را به 2 تقسیم کنیم
بعد با قی مانده را نگه داریم و خارج قسمت را به 2 تقسیم کنیم
دوباره باقی مانده را نگه می داریم و خارج قسمت را به 2 تقسیم می کنیم ، این کار و ادامه میدهیم تا جایی که خارج قسمت 0 بشه
سپس باقیماندهها را یادداشت میکنیم به این صورت که اولین باقیمانده را در سمت راست و آخرین باقیمانده را در سمت چپ مینویسیم
که برای عدد 253 ای که ما داشتیم جواب برابر 11111101 می شود
حالا فرض کنید ما می خواهیم حاصل تبدیل ما از دسیمال به باینری یک عدد 8 رقمی باشه و لی جواب ما کمتر از 8 رقم بشه . مثلا فرش کنید شده 11101 یعنی 5 قم ، پس ما 3 رقم کم داریم ، برای همین به سمت چپ به تعدادی که لازم داریم 0 اضافه می کنیم . پس میشه 00011101
شما برای تمرین چند تا عدد رو به باینری تبدیل کنید ، برای مثال 132 و 80 رو به باینری تبدیل کنید
اما حالا تبدیل باینری به دسیمال : ( مبنای 2 به مبنای 10 )
فرض کنید حالا ما می خواهیم عدد باینری 11111101 را به دسیمال تبدیل کنیم ( عکس عمل قبلی )
برای اینکار میایم عدد اول از سمت راست یعنی 1 را در 1 ضرب می کنیم
1*1
بعد عدد دوم از سمت راست را که میشه 0 در 2 ضرب می کنیم
0*2
بعد عدد سوم از راست که میشه 1 را در 4 ضرب می کنیم ، عدد بعدی در 8 ، بعدی 16 و ...
و در انتها جواب همه ضرب ها رو با هم جمع می کنیم
برای مشخص کردن تعداد چیزها آن ها را می شماریم. این شمارش باید در دستگاه مشخصی و در چهارچوب خاصی انجام گیرد. به طور معمول شمارش در دستگاه دهدهی انجام می شود، یعنی دستگاهی که مبنای شمارش ر آن ۱۰ است. در این دستگاه واحد هر مرتبه ۱۰برابر واحد مرتبه ی قبلی است. مثلاً واحد مرتبه هزارگان ۱۰برابر واحد مرتبه ی صدگان است و واحد مرتبه ی صدگان۱۰برابر واحد مرتبه ی دهگان است و واحد مرتبه ی دهگان ۱۰برابر واحد مرتبه ی یکان می باشد.
اما آیا می توان شمارش را به گونه ای دیگر نیز انجام داد ؟
به مثال زیر توجه کنید:
مدیر یک کارخانه ی لیوان سازی به انباردار خود دستور داد آمار تمام لیوان های موجود در انبار کارخانه را به او بدهد. در واحد بسته بندی این کارخانه هر ۶ عدد لیوان را در یک بسته پلاستیکی و هر ۶ بسته را در یک کارتن و هر ۶ کارتن را در یک جعبه و بعد هر ۶ جعبه را در یک صندوق چوبی بزرگ قرار می دهند. سپس صندوق ها را بار قطار کرده و برای مشتریان خود به شهرهای دور و نزدیک می فرستند. انباردار برای شمارش تعداد لیوان ها جدولی را که در اختیار داشت به صورت زیر کامل کرد:
واحد
یکی
بسته
کارتن
جعبه
صندوق
تعداد
۲
۱
۴
۱
۵
او در گزارش خود تعداد لیوان های موجود را ۵۱۴۱۲ نوشت. اما وقتی تعجب مدیر کارخانه را دید ساعتی بعد آن را اصلاح کرد و تعداد لیوان ها را ۶۸۴۸ اعلام کرد .
آیا به نظر شما او دروغ گفته بود ؟
خیر. او هر دو بار راست گفته بود ولی فراموش کرده بود که روش شمارش لیوان ها را توضیح دهد. در مرتبه ی اول او تعداد لیوان ها را بر اساس چگونگی بسته بندی آن ها حساب کرده بود. در این روش شمارش در مبنای ۶ انجام گرفته بود و او می بایست تعداد لیوان ها را ۶(۵۱۴۱۲) ثبت می کرد. در مرتبه ی دوم او با توجه به این که می دانست در هر بسته ۶ لیوان و در هر کارتن۶*۶لیوان و در هر جعبه ۶*۶*۶ لیوان و در هر صندوق ۶*۶*۶*۶ لیوان وجود دارد، جدول خود را به صورت زیر کامل کرد :
واحد
یکی
بسته
۶تایی
کارتن
۳۶ تایی
جعبه
۲۱۶ تایی
صندوق
۱۲۹۶تایی
تعداد
۲
۶
۱*
۳۶
۴ *
۲۱۶
۱ *
۱۲۹۶
۵ *
۲
۶
۱۴۴
۲۱۶
۶۴۸۰
و سپس مجموع آن ها را به دست آورد : ۶۸۴۸ = ۲+ ۶ + ۱۴۴ + ۲۱۶ + ۶۴۸۰
این عدد تعداد لیوان ها را در مبنای ۱۰ نشان می دهد. پس : ۶۸۴۸ = ۶( ۵۱۴۱۲ )
سؤال : در آمارگیری ماه بعد او تعداد لیوان ها را ۶( ۱۴۰۲۰ ) به دست آورد. به نظر شما او چه عددی را باید در گزارش خود به مدیر کارخانه بنویسد؟
* * * * *
اگر بخواهیم عددی را که در مبنای غیر ۱۰ نوشته شده به مبنای ۱۰ ببریم. رقم های آن را در توان های مختلف مبنا ضرب می کنیم و سپس مجموع آن ها را به دست می آوریم.
مثال۱ نمایش معمولی عدد ۶( ۱۰۵۳) را بنویسید .
۲۴۹= ۳+ (۶*۵) + ( ۳۶*۰) + ( ۲۱۶*۱) = ۶( ۱۰۵۳)
مثال۲ نمایش ۵۳۲ را در مبنای ۶ به دست آورید.
۶( ۲۲۴۴) = ۵۳۲
· اگر در مثال های بالا توجه کرده باشید خواهید دید اگر عددی را از یک مبنا به مبنای کوچک تری ببریم نمایش ظاهری عدد بزرگ تر خواهد شد و اگر آن را در مبنای بزرگ تری بنویسیم نمایش ظاهری اش کوچک تر می شود .