نمونهسازی تجزیه و تحلیل غیر ساختاری
یک آزمایش مهم ساختار خدمات PAMML که تحت حمایت این مقاله است مربوط به توانایی آن در مدلگذاری مورد آزمایشی است تجزیه و تحلیل غیرساختاری Mass GIS . این آزمایش تجربی در اینجا ارائه میشود. از طریق مرجع دادن مسائل موجود در فصل 3 و پرداختن به جزئیات اینکه چطور ساختار PAMML آنها را مخاطب قرار میدهد، ما قادر هستیم که بگوییم PAMML نه تنها میتواند انواع تجزیه و تحلیلها رایج برنامهریزان فیزیکی را کاهش دهد، بلکه قادر است به هزینههای زیاد مدیریت مشارکتی اطلاعات و پردازش بپردازد . در این روش مافراتر از بحث اصلی که در بسیاری سیاستها رایج است میرویم که میگوید کاربرد خدمات وب تثبیت شدهاند تا هزینهها را کاهش دهند، بنابراین اگر بتوانیم ابزارهای قدیمی حمایت از برنامهریزی را در اوج معماری خدمات وب دوباره بسازیم، بطور طبیعی هزینهها را در سیاست برنامهریزی کاهش خواهیم داد. این بحث قانع کننده است ولی هرکس میتواند بگوید که سیاست برنامهریزی آن گونه از خصوصیات منحصر به فرد را نشان میدهد که از فواید سازگاری تکنولوژیهای دیگر زمینهها جلوگیری میکند از طریق اشاره آشکار مسائل مدیریت اطلاعات در تجزیه و تحلیل غیرساختاری، ما تا حد چشمگیری موقعیت PAMML را استحکام میبخشیم .
دادههای جسد متحرک: مفهوم دادههای جسد متحرک که پیش از این توسعه یافته را به خاطر بیاورید. اینها دادههایی هستند که از نگهدارنده شان بدست آمدهاند و بعدا برای سالها یا ماهها بکار برده میشوند و شاید بعد از شناخت با دانش محلی با کمترین ملاحظه است تغییرات نگهدارنده در طول آن زمان ساخته شوند. این دادهها در واقع وقتی از حیات خود یعنی منابع به روزرسانی قطع اتصال کنند از بین میروند. همچنین بازهم زنده هستند چون مالک شان هنوز آنها را مفید میداند.
مسئله دادههای جسد متحرک در قسمت اصلی وضع دشوار هزینه مدیریت اطلاعات قرار دارد. مردم از تجهیزات انتظار دارند که سبک باشند و آگاهی اینترنتی در عملکردهای محدودشان داشته باشند مثل ابزار غیرساختاری آنلاین EOEA که پیش از این به آن اشاره شد، تا آمارهای را برای شهرهای چند گونه و مختلف جمعاوری کنند. آنها به ابزارهای تجزیه و تحلیل پختهتر و غنی از خصوصیات معتقدند مثل Arcview یا Geo Vista که عمدتا به منابع دادههای محلی بستگی دارند و اینکه مسئله مدیریت دادهها در نرمافزار تجزیه و تحلیل یک مسئله خارجی است.
این نکته مسئله اصلی راهکار غیرساختاری Mass GIS است. آنها ابزارهای تجزیه و تحلیل خیلی عالی را فراهم میکنند به شکل Excel و Arcview . همچین فراهم میکند که جعبه ابزار تجزیه و تحلیل غیرساختاری نام دارد. آنچه که به آن توجه نمیکنند، سوال مربوط به مدیریت دادههاست. خیلی خوب شد اگر مدیرتی اطلاعات مرکز پیشرفت مفید تجزیه و تحلیل نبود. اگر دادهها به ندرت
تغییر میکردند. هزینه انجام چیزهای مختلف از کسر سودها بیشتر می شد اما موضوع این نیست برنامهریزان میخواهند که بطور پیوسته برنامهریزی کنند، آنها هیچ انتخاب مسیری ندارند که هزینه را موثر کنند بنابراین وظیفه ما اینست که ساختار PAMML با هزینههای معقولی به پیش ببریم. در فصلهای قبلی به موضوع تکنولوژی اندازهگیری پرداختیم . هزینههای اجرای یک سیستم باید تا حد زیادی اندازهگیری شود از همان آغاز پرروژه وقتی بودجههای زمانی اختصاص داده میشوند و حمایت از پروژه تقویت میشود. هزینههای در حال اجرا باید تا حد ممکن کم باشند. در غیراینصورت زیربنای تکنولوژی بخاطر عدم حفظ و نگهداری یکپارچگیاش را از دست خواهد داد . برای دستیابی به هزینههای پایین، برنامهریزی زیربنای ST باید تا حد امکان و هرچه بیشتر زیربنای IT را بطور کلی بکار ببندد. در اینجا ما به عمق جزئیات میرویم و نشان میدهیم که یک مدل عملیاتی که چطور ساختار PAMML سندرم دادههای جسد متحرک را مخاطب قرار میدهد و توجه زیادی به موضوع ردهبندی کرد تکنولوژی دارد. جدول 1 ماتریکس تلاش/ هزینه را برای سه راهکار مختلف مدیریت دادهها فهرست بندی میکند. اولین آن «ارسال دادهها» قدیمیترین است که شامل نگهدارنده دادهها در ارسال نامه یا ایمیلزدن مجموعه دادهها به هر کاربرد میباشد. وقتی دادهها تغییر میکنند گل پروسه باید تکرار شود. دردومین راهکار انتشار دادهها وب سایت که در حال حاضر پیشرفتهترین است نگهدارنده دادهها از وب برای عدم ارسال به روزرسانی به هر کاربر استفاده میکند. به جای آن یک کپی از دادهها را در وب سایت بر روزرسانی میکند و سپس به کاربر اطلاع میدهد که میتواند آن را دانلود کند. این راهکار ثابت شده که تا حد زیادی ذخیره کننده زمان است که در آن نماینده نگهداری دیگر مجبور نیست درخواستهای اطلاعات را کنترل کند یعنی وب یک سیستم خود خدماتی است، ولی به هزینههای کاربران نمیپردازد.
راهکار PAMML نیاز به انتشار ابتدایی یکسان بسیار زیادی دارد. ولی نرمافزار از به روزرسانی در جریان بین منتشر کنندههای دادهها و کاربران توجه میکند همانطور که در فصل 4 گفته شد سادهترین تکنیک انتشار دادهها که PAMML ارائه میکند. بیشتر شبیه به ارسال فایلهای دادهها در وب سایت است. تفاوت اصلی اینست که به جای طراحی یک صفحه وب HTML برای تکمیل فایل دادهها منتشر کننده، یک فایل PAMML WSDL (زبان توصیف خدمات وب) و یک فایل فوری دادههای PAMML را طراحی میکند. برای استفاده از دادهها، یک کاربر در خدمات داده ها «نام نویسی» میکند و از آن لحظهبه بعد نرمافزار قادر است یک کپی محلی از مجموعه دادهها را بسازد (برای افزایش عملکرد) و بطور دورهای با چک کردن منتشر کننده دادههای اصلی برای به روز رسانی عمل میکند.
این کار موانع کار کاربران و منتشر کنندگان را کاهش میدهد، هزینه انجام و عملیات مدیریت اطلاعات را به حداقل میرساند. هزینههای به روز نگهداشتن دادهها بر مبنای طراحی نرمافزار و مرحله توسعه تغییر میکنند، وقتی در طول هزاران کاربر گسترده میشوند به جای اینکه هزاران کاربر هر یک راه حلهای فردی خودشان را داشته باشند. همچنین PAMML به نوع دیگری از مسائل دادههای جسد متحرک اشاره میکند. تقسیم دادهها اغلب بدون آگاهی نگهدارنده رسمی دادهها صورت میگیرد. علاوه بر احتمال قدیمی بودن دادهها این کار به موقعیتهایی میانجامد که دادهها بتواند در راههایی استفاده شوند که از ابتدا به آن منظور نبودهاند. اشاره به این موضوعات انگیزه کار کاتالوگ گذاری دادهها را در نمایندگیها ایجاد میکند از قبیل FGDC (www.fgdc.gov در ساختار کاری PAMML فایل توصیف دادهها تقسیم میشود (کد لیست b-1) و خود دادهها تقسیم نمیشوند کاربرد جدید این فایل XML را میگیرد و آن را برای مشترک کردن مستقیم خدمات دادهها از منتشر کننده بکار میبرد. این کار دو هدف دارد. اول اینکه کاربر جدید آخرین نوع دادهها را میگیرد. این یک ویژگی خوب است ولی اهمیت واقعی این راهکار اینست که کاربران به مجموعه دادههای اطراف کاری ندارند. بطور موثری آنها با یک قرارداد سروکار دارند که با منتشر کننده دادهها در تماساند.
وقتی کاربر جدید در تلاش است که به دادهها دسترسی یابد. منتشر کننده فرصت دارد که تصمیم بگیرد آیا با آن کاربر تجارت کند یا نه اگر دادهها عمومی و رایگان باشند هیچ اتفاق مهمی در این مرحله نمیافتد و به سادگی به کاربر فرستاده میشود. با این حال اگر دادهها به همین روش حساس باشند. منتشر در این لحظه اعتبار کاربر را بررسی میکند و مطابق آن عمل میکند و البته اگر کاربران عمدا نخواهند که سیستم را خراب کنند، آنها استفاده از ساختار PAMML با روشهای گذشته را انتخاب خواهند کرد چرا که همانطور که گفته شد PAMML آسانترو ارزانتر است. و با انجام این کار ما ارتباط قرارداد را (اجتماعی ، فنی یا تجاری) را میان منتشر کنندگان و کاربران تفویت و استحکام میبخشیم.
در مورد یک مجموعه جداگانه نظریه قرارداد بین منتشر کننده و کاربر بسیار حیاتی بنظر میرسد. حتی با اهمیت ترهم میشود وقتی یک مدل واقعی باید مثل تجزیه و تحلیل غیر ساختاری را بحث میکنیم که برخی موضوعات مربوط به قرارداد را بر میانگیزد آیا مشتری از سرور منابع پردازش استفاده میکند. اگر این کار را میکند آیا ما باید این اجازه را بدهیم آیا آنها یک نمایندگی عمومی ،فردی یا یک توسعه دهنده زمیناند؟ آیا ما باید مسئولیت سوددهی شرکت را برای دسترسی متقبل شویم؟ همه این موضوعات راه حلهای فنی دارند. و تجهیزات PAMML با مزیت هماهنگی با خدمات وب بطور حتم قادرند با کمترین هزینه به آنها پاسخ دهند چون میتوانند از شناسایی عمومی و تکنیکهای امنیتی طراحی دشه در خدمات وب استفاده کنند به جای اینکه سیستمهای جدیدی برای دولت یا برنامهریزی اختراع کنند.
بحث دادههای جسد متحرک با هدف کاهش هزینهها و پیچیدگی (تلاش) حفظ به روزرسانی دادهها آغاز شد . ما نشان دادیم که چطور PAMML میتواند آن مسئله را حل میکند ولی موضوع کلیتری وجود دارد که به آن بپردازیم همانطور که پیش از این گفته شد هیچ تفاوت واقعی میان یک مجموعه دادهها و یک مدل وجود ندارد . یک مجموعه دادهها میتواند بعنوان یک خلاصه مختصر از برخی پردازش تحلیلی در نظر گرفته شود. بنابراین هر راه حل در مسئله دادههای جسد متحرک هم باید در مدلهای تحلیلی اجرا شود. در واقع مسئله همین است. بیادآورید که در یک ساختار کاری PAMML کاربرد از طریق نام نویسی در خدمات PAMML به دادهها دسترسی پیدا میکند. جزئیات این نام نویسی در یک فایل فوری دادههای PAMML ذخیره شدهاند صحیحتر آنست که بگوییم در یک فایل فوری مدل چون میدانیم که PAMML این دو تا را متمایز از هم نمیداند بنابراین در معماری PAMML (از دیدگاه کاربر) هیچ تفاوتی میان دسترسی به یک مجموعه داده و دردسترسی به یک مدل پیچیده وجود ندارد. با این حال از دیدگاه منتشر کننده شاید تفاوت زیادی وجود داشته باشد. اگر هدف منتشر کننده اینست که دسترسی تعاملی به مدل را فراهم کند پس بطور حتم به چیزی بیش از یک وب سرور ساده برای رسیدن به این هدف نیاز دارد آنها در ابتدا مدل را در PAMML توصیف میکنند.