بخشی از متن:
چکیده:
پایگاه اطلاعاتی آماری (SDB) پایگاهی است که از آن استفاده می کنند تا اطلاعات آماری استخراج شده از ثبت ها را به استفاده کننده ها برگردانند تا برای تحلیل های آماری از آنها استفاده کنند. گاهی اوقات، با ربط دادن اطلاعات کافی داده های محرمانه ای در مورد یک شخص را می توان حدس زد. نمونه ای از اطلاعات محرمانه ذخیره شده در SDB ممکن است در مورد حقوق ها یا تاریخچه پزشکی اشخاص باشد. مسئله مهم، فراهم کردن امنیت برای SDB در مقابل افشا شدن اطلاعات محرمانه می باشد. یک پایگاه اطلاعاتی در صورتی امن خواهد بود که با سوال های در دسترس نتوان هیچگونه اطلاعاتی را از آن حدس زد. یکی از شیوه های کنترل امنیتی که در نوشته ها توصیه شده است شامل، در مورد محدودیت سوال پرسیدن است: مسئله امنیت این است تا استفاده از SDB را محدود کند، یک مکانیسم کنترل معرفی کند، به شکلی که هیچ اطلاعات محافظت شده ای را نتوان از سوال های در دسترس به دست آورد. جین و اوزمویوگلو یک مکانیسم کنترل معرفی کردند به نام Audit Expert (متخصص بازبینی) که فقط سوال های SUM، یعنی میزان خاصی از اطلاعات ثبت شده اشخاص در دسترس استفاده کننده ها هستند. این مدل سوال کردن SUM منجربه چند مسئله بهینه سازی چالش انگیز می شود. فرض کنید n تا ثبت عددی {Z1,…,Zn} در پایگاه اطلاعاتی وجود دارد. یک مسئله طبیعی این است تا تعداد سوال های SUM قابل پاسخ را به حداکثر برسانیم، یعنی تعداد جمع زیرمجموعه {Z1,…,Zn} که می توان آنها را بازگرداند، به شکلی که هیچ کدام از عددهای Zi را نتوان از این سوال ها حدس زد. در این مقاله محدوده های محکمی را برای این عدد تحت محدودیتهایی روی سایز و بُعد مجموعه های سوالی ارائه می دهیم.
فهرست مطالب:
چکیده
مقدمه
نتایج اصلی
رعایت HIPAA
پیش پردازش ها یا تبدیل داده ها
ویژگی های مقیاس بندی، رمزگذاری و انتخاب
برآورد مدل یا کاوش در داده ها
تفسیر نتیجه یا تفسیر مدل و رسیدن به نتایج
آماده سازی داده ها
نمایش جدولی یک مجموعه داده ها
داده های از دست رفته
تحلیل داده های نامنطبق
انواع داده های آماری
محدودیتهای مجموعه ی پرس و جو
انحراف برون داد
بیان مثالی از بانک های اطلاعات آماری
منابع