לפני שנתחיל ללמוד לכתוב ב R, נלמד על סביבת העבודה שבה נעבוד במהלך הקורס. חשוב ליצור הרגלים טובים של מהלך עבודה מההתחלה כך שנתרגל לעבוד בצורה יעילה ולנצל את כל האפשרויות העומדות לרשותינו.
עד סוף השיעור הקצר הזה:
RSTUDIO הוא ממשק המאפשר עבודה נוחה ויעילה עם תוכנת R. הממשק מפעיל את תוכנת R ומאפשר שליחת קוד אל תוכנת R וקבלת פלט חזרה ממנו, זאת כאשר תוכנת R עצמה מכילה בעיקר CONSOLE המקבל פקודות ומבצע חישובים סטטיסטיים.
יש ארבע חלוניות ב RSTUDIO ובתוך רוב החלוניות יש מספר טאבים שאפשר לבחור.
ניתן בקלות להגדיל ולהקטין את החלוניות עם העכבר.
ניתן גם לשנות את מיקומן של החלוניות מתוך: Tools -> Global options -> Panes
להלן הסבר קצר לגבי תפקידן של ארבעת החלוניות:
פרוייקט שומר תמונת מצב של סביבת העבודה הפתוח, כך שבפעם הבא שפותחים R כל העבודה שעשינו זמינה ואפשר להמשיך מאיפה שהפסקנו.
בנוסף, עבודה עם פרוייקטים מיעלת את תהליך העבודה ב R בכך שהיא עוזרת לנו לשמור את כל המסמכים הרלוונטיים לפרוייקט במקום אחד - שכן כל פרוייקט משוייך לתיקייה מסוימת.
חשוב להדגיש שלא חייבים לעבוד עם פרוייקט, והכלי נועד רק על מנת לעזור לנו לעשות סדר בתהליך העבודה
כשפותחים פרוייקט חדש נפתחת תיקייה חדשה המכילה את הקבצים הבאים:
למעשה בפתיחת הפרוייקט רק הקובץ הראשון נפתח, אך לאחר שמירה ראשונה של הפרוייקט יתווספו שאר הקבצים.
אפשר לייצר פרוייקט חדש באחד משני דרכים:
ניתן לפתוח פרוייקט קיים באחד משני דרכים:
אחרי שפותחים פרוייקט, תיקיית הבית שלנו (תיקיית ברירת המחדל של שמירת וחיפוש קבצים) מתעדכנת להיות תיקיית הפרוייקט.
עבודה עם script ים מאפשרת לנו לשמור את הקוד שאנו כותבים ולבצע חלקים ממנו או את כולו עכשיו או בזמן מאוחר יותר.
במקרים בהן תהליך העבודה שלנו מורכב ממספר שלבים שונים, רצוי לחלק אותם למספר script ים שונים.
בנוסף מומלץ (לא חובה) ששמות ה script ים השונים יתחילו במספור ולאחר מכן שם הממחיש את מטרת ה script
לדוגמא:
01-Importing Data
02-Preprocessing Data
03-Summarizing Data
ב RSTUDIO יש כל מיני סוגי script - ים שאפשר לעבוד אתם, כאשר ההבדל בינהים הוא מבחינת סוג התיעוד שנרצה לתהליך העבודה.
למרות ההבדלים בין ה script ים , כולם בסופו של דבר הם קבצי טקסט רגילים שניתן לערוך מכל editor שנרצה.
ה Script ים העיקריים הם:
ניתן ליצור script R חדש מכל אחד מהסוגים המוזכרים לעיל בשתי דרכים:
ניתן לפתוח script קיים בכמה מקומות:
ב script R בסיסי, כל שורה מתורגמת כקוד.
Run
.Source
.#
מסומנת כהערה.פתחו script R בסיסי חדש ושמרו אותו בשם Lesson1-basic.
הוסיפו את הקטע קוד הבא:
print("hello world")
hist(rnorm(10000))
ה script ים החדשים יותר מתבססים על שפת ה markdown לעריכת המסמך.
ב script של rmarkdown, השטח הלבן הוא קוד של markdown והשטח האפור מהווה קטעי קוד של R או chunks.
עיקרי שפת ה markdown הם:
#
מהווה כותרת ראשונה##
מהווה כותרת שניה , וכו’*
יתורגם כ bullet**text**
יתורגם כ bold text*text*
יתורגם כ italic textאת שאר כללי ה markdown תוכלו לראות ב cheatsheet של markdown שתוכלו להוריד מ:
help>> Cheatsheets>> R Markdown Cheatsheet
ניתן להוסיף קטע קוד של R בעזרת הקיצור: Ctrl+Alt+I ; או לחיצה על האייקון Insert
ניתן להריץ קטע קוד של R על ידי הקיצור : Ctrl+Shift+Enter ; או על ידי לחיצה על המשולש הירוק; או על ידי לחיצה על Run
לאחר שמסיימים לערוך את מסמך ה Rmd ניתן ללחוץ על האייקון knit
כדי לשמור את הפלט באחד הפורמטים (או במספר פורמטים בו זמנית): word, hmtl, או PDF.
הקובץ נפתח עם template של קוד מוכן לריצה
הריצו את ה chunk הראשון המתחיל בשורה 16.
הריצו את ה chunk השני המתחיל בשורה 24.
תוסיפו בסוף ה script קטע קוד של R המכיל את הקוד הבא:
head(iris)
הפקודה head
מחזירה כפלט 5 שורות ראשונות של אובייקט יש מספר טבלאות מובנות ב R, אחד מהם הוא iris
המכיל נתונים על כלניות הפקודה data
מחזירה רשימה עם שמות טבלאות הנתונים הנמצאים בחבילה מסוימת
data(package= "datasets")
knitr
והמירו את התוצאות לקובץ html.להלן רשימה של קיצורי הדרך הכי שימושיים:
רשימה של כל קיצורי הדרך נמצאת ב : Tools - > Keyborad shortcut help