שינויים

נוספו 5 בתים ,  18:57, 18 בדצמבר 2017
מ
אין תקציר עריכה
שורה 1: שורה 1: −
'''נתונים פתוחים''' או '''נתונים גולמיים חופשיים''' (באנגלית: Open data) הוא רעיון לפיו חלק מהנתונים הגולמיים צריכים להיות זמינים לכל אדם, כך שניתן להשתמש בהם ולפרסם אותם מחדש בצורה חופשית, ללא מגבלות כמו זכויות יוצרים, פטנטים, או מכניזמים אחרים של שליטה. המטרה של "תנועת הנתונים הפתוחים" (Open data movement) דומה למטרות של תנועות אחרות של "פתיחות" כמו [[קוד פתוח]], [[תוכן פתוח]] ו[[גישה פתוחה]]. הפילוסופיה מאחורי נתונים פתוחים פותחה מזה זמן רב (לדוגמה ב-Merton Thesis לגבי מדע). עם זאת המונח "נתונים פתוחים" הוא חדש יחסית, והוא צובר תאוצה עם הפיתוח של רשת האינטרנט. במיוחד עם הפתיחה של יוזמות ממשל עם נתונים פתוחים (open-data government) כמו Data.gov.
+
'''נתונים פתוחים''' או '''נתונים גולמיים חופשיים''' (באנגלית: '''Open data''') הוא רעיון לפיו חלק מהנתונים הגולמיים צריכים להיות זמינים לכל אדם, כך שניתן להשתמש בהם ולפרסם אותם מחדש בצורה חופשית, ללא מגבלות כמו זכויות יוצרים, פטנטים, או מכניזמים אחרים של שליטה. המטרה של "תנועת הנתונים הפתוחים" (Open data movement) דומה למטרות של תנועות אחרות של "פתיחות" כמו [[קוד פתוח]], [[תוכן פתוח]] ו[[גישה פתוחה]]. הפילוסופיה מאחורי נתונים פתוחים פותחה מזה זמן רב (לדוגמה ב-Merton Thesis לגבי מדע). עם זאת המונח "נתונים פתוחים" הוא חדש יחסית, והוא צובר תאוצה עם הפיתוח של רשת האינטרנט. במיוחד עם הפתיחה של יוזמות ממשל עם נתונים פתוחים (open-data government) כמו Data.gov.
    
[[תמונה:Opendata world.PNG|left|thumb|400px|מדינות בעלות אתרים ממשלתיים להפצת נתונים פתוחים, נכון לשנת 2012]]
 
[[תמונה:Opendata world.PNG|left|thumb|400px|מדינות בעלות אתרים ממשלתיים להפצת נתונים פתוחים, נכון לשנת 2012]]
שורה 23: שורה 23:  
בעבר הייתה הצדקה לכך שירחונים מדעיים עלו הרבה כסף. עלות ההפקה של המאמרים הייתה יקרה משום שהיה צריך להשקיע משאבים רבים בהכנת גרפים והכנות אחרות לדפוס, וכן היו עלויות הפצה גבוהות של הירחונים בכל העולם בתפוצה קטנה. היום שני דברים השתנו - בזכות הדפוס הדיגיטלי, תוכנות לעיבוד תמלילים, עימוד גרפי והכנת גרפים מדענים יכולים להכין בכוחות עצמם או עם סיוע קל את המאמר לדפוס. כמו כן ההפצה הוזלה מאד בזכות האינטרנט. כך שהעלויות של הכנת המאמרים המדעיים ירדו מאד. מצד שני עלויות ההרשמה לירחונים המדעיים עלו מאד, בין 1986 ל-2003 עלה ה[[מחיר הריאלי]] של ההרשמה (המחיר בהתחשב מחיר ה[[אינפלציה]]) ב-260%. מחיר העלות השנתית לירחון בכימיה הוא מעל 4,000 דולר בשנה, ומצב דומה יש גם בפיזיקה, ביולוגיה, ותחומים רבים נוספים. יש ירחון אחד עם עלות הרשמה שנתית של 40,000 דולר.[http://www.youtube.com/watch?v=L5rVH1KGBCY&feature=player_embedded&noredirect=1]  
 
בעבר הייתה הצדקה לכך שירחונים מדעיים עלו הרבה כסף. עלות ההפקה של המאמרים הייתה יקרה משום שהיה צריך להשקיע משאבים רבים בהכנת גרפים והכנות אחרות לדפוס, וכן היו עלויות הפצה גבוהות של הירחונים בכל העולם בתפוצה קטנה. היום שני דברים השתנו - בזכות הדפוס הדיגיטלי, תוכנות לעיבוד תמלילים, עימוד גרפי והכנת גרפים מדענים יכולים להכין בכוחות עצמם או עם סיוע קל את המאמר לדפוס. כמו כן ההפצה הוזלה מאד בזכות האינטרנט. כך שהעלויות של הכנת המאמרים המדעיים ירדו מאד. מצד שני עלויות ההרשמה לירחונים המדעיים עלו מאד, בין 1986 ל-2003 עלה ה[[מחיר הריאלי]] של ההרשמה (המחיר בהתחשב מחיר ה[[אינפלציה]]) ב-260%. מחיר העלות השנתית לירחון בכימיה הוא מעל 4,000 דולר בשנה, ומצב דומה יש גם בפיזיקה, ביולוגיה, ותחומים רבים נוספים. יש ירחון אחד עם עלות הרשמה שנתית של 40,000 דולר.[http://www.youtube.com/watch?v=L5rVH1KGBCY&feature=player_embedded&noredirect=1]  
   −
המצב הזה יוצר כל מיני בעיות, סטודנטים אינם יכולים לקרוא את המאמרים, ולפעמים גם מרצים מוגבלים בגישה ולא יכולים ללמד מחקרים חדשים. הדבר הוא בעייתי במדינות עניות שבהן האוניברסיטאות לא יכולות לעמוד בתשלום לכל הירחונים. מצד שני המצב אבסורדי היות והמיסים הממשלתיים משלמים על המחקר, וגם עבודת הסינון של המאמרים והריוויו נעשים על ידי מדענים אחרים ולא על ידי הירחון עצמו (וגם מדענים אלה מקבלים סיוע מכספי המיסים). מצד שני הציבור עצמו ששילם על כל המחקר הזה לא מקבל גישה לנתונים ולמחקרים באופן ישיר.
+
המצב הזה יוצר כל מיני בעיות, סטודנטים אינם יכולים לקרוא את המאמרים, ולפעמים גם מרצים מוגבלים בגישה ולא יכולים ללמד מחקרים חדשים. הדבר הוא בעייתי במדינות עניות שבהן האוניברסיטאות לא יכולות לעמוד בתשלום לכל הירחונים. מצד שני המצב אבסורדי היות והמיסים הממשלתיים משלמים על המחקר, וגם עבודת הסינון של המאמרים והריוויו נעשים על ידי מדענים אחרים ולא על ידי הירחון עצמו (וגם מדענים אלה מקבלים סיוע מכספי המיסים). מצד שני הציבור עצמו ששילם על כל המחקר הזה לא מקבל גישה לנתונים ולמחקרים באופן ישיר.
    
==דוגמאות לשימושים==
 
==דוגמאות לשימושים==
שורה 50: שורה 50:  
ממשלת ישראל פתחה אתר נתונים בשם [http://data.gov.il/ data.gov.il]. האתר נפתח בעקבות החלטת ועדת השרים לעניין שיפור השירות הממשלתי לציבור וממשל פתוח, שנתקבלה  ביום ב', 29 בנובמבר, 2010. במשך שנים לא נוספו לאתר נתונים וסדרות לדוגמה בשנת 2012, היו במאגר כ-70 דוחות בלבד.  
 
ממשלת ישראל פתחה אתר נתונים בשם [http://data.gov.il/ data.gov.il]. האתר נפתח בעקבות החלטת ועדת השרים לעניין שיפור השירות הממשלתי לציבור וממשל פתוח, שנתקבלה  ביום ב', 29 בנובמבר, 2010. במשך שנים לא נוספו לאתר נתונים וסדרות לדוגמה בשנת 2012, היו במאגר כ-70 דוחות בלבד.  
   −
בנובמבד 2017 הושק אתר נתונים חדש ובו כ-511 מאגרי נתונים שונים, כולל נתונים על תחבורה, שכבות מידע גאוגרפיות, נתונים על תוכניות בנייה, נתונים על מחצבות, על תאונות דרכים, מוקדי פשיעה, מוקדי יתושים, נתונים זיהום ממפעלים ועוד נושאים. {{הערה|[http://www.ynet.co.il/articles/0,7340,L-5040057,00.html מהפכה בחשיפת המידע הממשלתי לציבור ברשת]  סה"כ מיפו משרדי הממשלה וארגונים ממשלתיים שונים 1025 סדרות נתונים שחלקם אמור להתפרסם בעתיד, מתוכם נטען כי 625 מאגרים פורסמו בעבר.  
+
בנובמבר 2017 הושק אתר נתונים חדש ובו כ-511 מאגרי נתונים שונים, כולל נתונים על תחבורה, שכבות מידע גאוגרפיות, נתונים על תוכניות בנייה, נתונים על מחצבות, על תאונות דרכים, מוקדי פשיעה, מוקדי יתושים, נתונים זיהום ממפעלים ועוד נושאים. {{הערה|[http://www.ynet.co.il/articles/0,7340,L-5040057,00.html מהפכה בחשיפת המידע הממשלתי לציבור ברשת]  סה"כ מיפו משרדי הממשלה וארגונים ממשלתיים שונים 1025 סדרות נתונים שחלקם אמור להתפרסם בעתיד, מתוכם נטען כי 625 מאגרים פורסמו בעבר.  
    
ארבעת הגופים שפרסמו הכי הרבה נתונים כללו את המרכז למיפוי ישראל שפרסם 110 מסמכים, חלקם הגדול תצלומי אוויר או נתוני מידע גאוגרפי (GIS), [https://data.gov.il/dataset?organization=israel_mapping_center] [[המשרד להגנת הסביבה]] שפרסם 62 מאגרי נתונים כולל מאגרי המפל"ס, [https://data.gov.il/dataset?organization=ministry_of_the_environment] ומשרד התיירות שפרסם 53 מאגרים. [https://data.gov.il/dataset?organization=ministry_of_tourism]. [[משרד האוצר]] פרסם 33 נתוני תקציבים שונים אך לא פרסם נתונים כלכליים הנוגעים ל[[כלכלת ישראל|משק בישראל]]. [https://data.gov.il/dataset?organization=mof]  
 
ארבעת הגופים שפרסמו הכי הרבה נתונים כללו את המרכז למיפוי ישראל שפרסם 110 מסמכים, חלקם הגדול תצלומי אוויר או נתוני מידע גאוגרפי (GIS), [https://data.gov.il/dataset?organization=israel_mapping_center] [[המשרד להגנת הסביבה]] שפרסם 62 מאגרי נתונים כולל מאגרי המפל"ס, [https://data.gov.il/dataset?organization=ministry_of_the_environment] ומשרד התיירות שפרסם 53 מאגרים. [https://data.gov.il/dataset?organization=ministry_of_tourism]. [[משרד האוצר]] פרסם 33 נתוני תקציבים שונים אך לא פרסם נתונים כלכליים הנוגעים ל[[כלכלת ישראל|משק בישראל]]. [https://data.gov.il/dataset?organization=mof]  
שורה 56: שורה 56:  
חלק ממאגרי הנתונים מכילים מידע באיכות נמוכה - מידע לקוני, שניתן למצוא במקומות אחרים או בעל משמעות ציבורית נמוכה מאד. דוגמה אחת לכך היא "מאגרי מידע" שכולל כמה עשרות פריטים והם יותר קרובים למסמך ממשלתי מאשר מאגר נתונים - לדוגמה משרד החקלאות פרסם רשימה של "מוצרים בפיקוח - מוצרי חלב, ביצים, פירות וירקות" - שמכילה 12 מוצרים. דוגמה אחרת היא הסתפקות בפרסום מידע דל על הגוף עצמו במקום על התחום בו עוסק המשרד - לדוגמה משרד הבריאות פרסם 3 מאגרי נתונים שכולם הם בעצם רשימות של מרפאות או מעבדות רפואיות. נתונים על [[בריאות הציבור]] כמו [[עישון בישראל|כמות ופריסה של מעשנים]], או התפלגות של [[אי שוויון בריאותי]] וסוגי תחלואה שונים לא פורסמו. [https://data.gov.il/dataset?_organization_limit=0&organization=ministry-health].  
 
חלק ממאגרי הנתונים מכילים מידע באיכות נמוכה - מידע לקוני, שניתן למצוא במקומות אחרים או בעל משמעות ציבורית נמוכה מאד. דוגמה אחת לכך היא "מאגרי מידע" שכולל כמה עשרות פריטים והם יותר קרובים למסמך ממשלתי מאשר מאגר נתונים - לדוגמה משרד החקלאות פרסם רשימה של "מוצרים בפיקוח - מוצרי חלב, ביצים, פירות וירקות" - שמכילה 12 מוצרים. דוגמה אחרת היא הסתפקות בפרסום מידע דל על הגוף עצמו במקום על התחום בו עוסק המשרד - לדוגמה משרד הבריאות פרסם 3 מאגרי נתונים שכולם הם בעצם רשימות של מרפאות או מעבדות רפואיות. נתונים על [[בריאות הציבור]] כמו [[עישון בישראל|כמות ופריסה של מעשנים]], או התפלגות של [[אי שוויון בריאותי]] וסוגי תחלואה שונים לא פורסמו. [https://data.gov.il/dataset?_organization_limit=0&organization=ministry-health].  
   −
מאגרים אחרים מציגים מידע שהוא כנראה חלקי מאד, עם כמות רבה של מידע משוכפל וחשיבות לא ברורה - לדוגמה משרד התיירות פרסם כ- 1776 רשומת על "אירועים" , כל אירוע הופיע בכמה רשומות שהכילו מידע על מיקום האירוע, טלפון, אימייל ועוד, כך שסה"כ פרסם המשרד 191 אירועים כמו "הופעה של אבי אביטל ועומר אביטל שני אמנים מעולם הג'אז" שנערכה ב 12.9.2017  [https://data.gov.il/dataset/1007/resource/5f220b0f-4d13-4d7f-a32d-197e327cc369?filters=SpecificationAttributeName%3A%D7%AA%D7%90%D7%A8%D7%99%D7%9A]- כאשר ברור כי מלבד אירועים אלה מתקיימים בישראל עוד עשרות אלפי אירועים אחרים בשנה. מאגרים אחרים של משרד התיירות כוללים מאגרים כמו "דילים" (על טיסות), ועוד. עם זאת משרד התיירות פרסם גם מאגרים משמעותיים יותר כמו מאגר של 39 אלף רשומות (הכוללות רשומות כפולות רבות) המתארות כ- 2600 מסעדות בישראל. [https://data.gov.il/dataset/restaurants/resource/7561521f-bd4c-4e76-935e-2d3daee22584?filters=SpecificationAttributeName%3A%D7%9B%D7%AA%D7%95%D7%91%D7%AA]
+
מאגרים אחרים מציגים מידע שהוא כנראה חלקי מאד, עם כמות רבה של מידע משוכפל וחשיבות לא ברורה - לדוגמה משרד התיירות פרסם כ-1776 רשומת על "אירועים", כל אירוע הופיע בכמה רשומות שהכילו מידע על מיקום האירוע, טלפון, אימייל ועוד, כך שסה"כ פרסם המשרד 191 אירועים כמו "הופעה של אבי אביטל ועומר אביטל שני אמנים מעולם הג'אז" שנערכה ב-12.9.2017  [https://data.gov.il/dataset/1007/resource/5f220b0f-4d13-4d7f-a32d-197e327cc369?filters=SpecificationAttributeName%3A%D7%AA%D7%90%D7%A8%D7%99%D7%9A]- כאשר ברור כי מלבד אירועים אלה מתקיימים בישראל עוד עשרות אלפי אירועים אחרים בשנה. מאגרים אחרים של משרד התיירות כוללים מאגרים כמו "דילים" (על טיסות), ועוד. עם זאת משרד התיירות פרסם גם מאגרים משמעותיים יותר כמו מאגר של 39 אלף רשומות (הכוללות רשומות כפולות רבות) המתארות כ- 2600 מסעדות בישראל. [https://data.gov.il/dataset/restaurants/resource/7561521f-bd4c-4e76-935e-2d3daee22584?filters=SpecificationAttributeName%3A%D7%9B%D7%AA%D7%95%D7%91%D7%AA]
    
רבים מתוך המאגרים נוגעים לנתונים פנים-ממשלתים כמו תקציבים, יחידות ממשלתיות, אנשים שקיבלו רשיונות שונים ועוד, מעט מאגרים נוגעים למחקרים ונתונים שהממשלה אוספת מהמשק עצמו. דוגמאות הפוכות בולטות כוללות את דוח המפל"ס של המשרד להגנת הסביבה (שכולל דיווחים של מפעלים מזהמים) או נתוני על זמנים ומיקומים של התחבורה הציבורית של משרד התחבורה.
 
רבים מתוך המאגרים נוגעים לנתונים פנים-ממשלתים כמו תקציבים, יחידות ממשלתיות, אנשים שקיבלו רשיונות שונים ועוד, מעט מאגרים נוגעים למחקרים ונתונים שהממשלה אוספת מהמשק עצמו. דוגמאות הפוכות בולטות כוללות את דוח המפל"ס של המשרד להגנת הסביבה (שכולל דיווחים של מפעלים מזהמים) או נתוני על זמנים ומיקומים של התחבורה הציבורית של משרד התחבורה.
שורה 62: שורה 62:  
בצד היוזמות הממשלתיות קמו גם יוזמות של אנשים וארגונים כדי להשיג, לקבץ, לעבד ולהפיץ נתונים חופשיים.  
 
בצד היוזמות הממשלתיות קמו גם יוזמות של אנשים וארגונים כדי להשיג, לקבץ, לעבד ולהפיץ נתונים חופשיים.  
   −
בשנת 2011 פעלה עמותת ויקימדיה ישראל שפעלהלפרסם לציבור ולאפשר שימוש חופשי בתמונות של ארכיון התמונות הממשלתי. [https://www.wikimedia.org.il/%D7%95%D7%99%D7%A7%D7%99%D7%9E%D7%93%D7%99%D7%94-%D7%99%D7%A9%D7%A8%D7%90%D7%9C-%D7%9C%D7%9E%D7%96%D7%9B%D7%99%D7%A8-%D7%94%D7%9E%D7%9E%D7%A9%D7%9C%D7%94-%D7%95%D7%A9%D7%A8-%D7%94%D7%94%D7%A1%D7%91/] בשנת 2012 פעלו הפעילים החברתיים נחמן שלף ויואב לרמן לפרסום פורמט GTFS שאיפשר פיתוח יישומים שונים שמציגים מידע על תחבורה ציבורית בזמן אמת כמו Moovit [https://tlv1.co.il/2012/05/13/%D7%94%D7%9E%D7%99%D7%93%D7%A2-%D7%91%D7%AA%D7%97%D7%91%D7%95%D7%A8%D7%94-%D7%94%D7%A6%D7%99%D7%91%D7%95%D7%A8%D7%99%D7%AA-%D7%99%D7%95%D7%A6%D7%90-%D7%9C%D7%97%D7%95%D7%A4%D7%A9%D7%99-%D7%95%D7%92/]
+
בשנת 2011 פעלה עמותת ויקימדיה ישראל שפעלה לפרסם לציבור ולאפשר שימוש חופשי בתמונות של ארכיון התמונות הממשלתי. [https://www.wikimedia.org.il/%D7%95%D7%99%D7%A7%D7%99%D7%9E%D7%93%D7%99%D7%94-%D7%99%D7%A9%D7%A8%D7%90%D7%9C-%D7%9C%D7%9E%D7%96%D7%9B%D7%99%D7%A8-%D7%94%D7%9E%D7%9E%D7%A9%D7%9C%D7%94-%D7%95%D7%A9%D7%A8-%D7%94%D7%94%D7%A1%D7%91/] בשנת 2012 פעלו הפעילים החברתיים נחמן שלף ויואב לרמן לפרסום פורמט GTFS שאיפשר פיתוח יישומים שונים שמציגים מידע על תחבורה ציבורית בזמן אמת כמו Moovit [https://tlv1.co.il/2012/05/13/%D7%94%D7%9E%D7%99%D7%93%D7%A2-%D7%91%D7%AA%D7%97%D7%91%D7%95%D7%A8%D7%94-%D7%94%D7%A6%D7%99%D7%91%D7%95%D7%A8%D7%99%D7%AA-%D7%99%D7%95%D7%A6%D7%90-%D7%9C%D7%97%D7%95%D7%A4%D7%A9%D7%99-%D7%95%D7%92/]
   −
היוזמה הבולטת ביותר בתחום הנגשת נתונים פתוחים בישראל היא [[הסדנא לידע ציבורי]] שמארגנת נתונים שונים ממוסדות ממשלתיים, מהכנסת ומארגונים רשמיים נוספים ומפרסמת את הנתונים ואו עיבוד נוח שלהם לציבור. הסנדא פיתחה מספר אתרים בנושא כמו [[התקציב הפתוח]], [[כנסת פתוחה]] ועוד.
+
היוזמה הבולטת ביותר בתחום הנגשת נתונים פתוחים בישראל היא [[הסדנא לידע ציבורי]] שמארגנת נתונים שונים ממוסדות ממשלתיים, מהכנסת ומארגונים רשמיים נוספים ומפרסמת את הנתונים ו/או עיבוד נוח שלהם לציבור. הסנדא פיתחה מספר אתרים בנושא כמו [[התקציב הפתוח]], [[כנסת פתוחה]] ועוד.
    
==ראו גם==
 
==ראו גם==