הקדמה

לפני שנתחיל ללמוד לכתוב ב R, נלמד על סביבת העבודה שבה נעבוד במהלך הקורס. חשוב ליצור הרגלים טובים של מהלך עבודה מההתחלה כך שנתרגל לעבוד בצורה יעילה ולנצל את כל האפשרויות העומדות לרשותינו.


מטרות

עד סוף השיעור הקצר הזה:

  • תבינו את מבנה סביבת העבודה של RSTUDIO
  • תכירו את סוגי ה script ים השונים ב R
  • תדעו לפתוח ולהשתמש בפרוייקטים ב RSTUDIO

הכרת סביבת העבודה

RSTUDIO הוא ממשק המאפשר עבודה נוחה ויעילה עם תוכנת R. הממשק מפעיל את תוכנת R ומאפשר שליחת קוד אל תוכנת R וקבלת פלט חזרה ממנו, זאת כאשר תוכנת R עצמה מכילה בעיקר CONSOLE המקבל פקודות ומבצע חישובים סטטיסטיים.

יש ארבע חלוניות ב RSTUDIO ובתוך רוב החלוניות יש מספר טאבים שאפשר לבחור.

ניתן בקלות להגדיל ולהקטין את החלוניות עם העכבר.

ניתן גם לשנות את מיקומן של החלוניות מתוך: Tools -> Global options -> Panes


חלונות העבודה

להלן הסבר קצר לגבי תפקידן של ארבעת החלוניות:

  1. חלונית ה script editor - פתיחת script חדש ושמירת הפקודות שנרצה להריץ באחד מקבצי ה script של R. מחלונית ה script editor ניתן לשלוח קוד לקונסול לביצוע - או לשמור את הקוד ולהריץ בזמן אחר. ניתן לפתוח כמה script ים במקביל.
    • עוד טאב שנראה בהמשך זה ה Viewer שמציג לנו את הטבלאות בצורה אקסלית.
  2. חלונית ה console - בקונסול ניתן לכתוב פקודות לביצוע מיידי ולראות את הפלט המתקבל
  3. חלונית ה Environment מכילה שני טאבים:
    • טאב Environment - המציגה מידע על אובייקטים הקיימים בסביבת העבודה שלנו
    • טאב History - השומר את הפקודות שביצענו בעבר באותו פרוייקט
  4. חלונית ה Workplace מכיל מספר טאבים:
    • טאב Files - כמו File Explorer של windows , כאשר ניתן לשנות את התיקייה הדיפולטיבית שמוצגת שם
    • טאב Plots - המציג פלט גרפי
    • טאב Packages - מציג רשימה של כל הספריות המותקנות לנו במחשב, ומשמש GUI נוח להתקנת ספריות חדשות ולטעינת ספריות
    • טאב ה Help - המציג לנו תיעוד לכל פונקציה שמוגדר בנתיב
    • טאב ה Viewer - משמש למשימות מיוחדות

עבודה עם פרוייקטים

פרוייקט שומר תמונת מצב של סביבת העבודה הפתוח, כך שבפעם הבא שפותחים R כל העבודה שעשינו זמינה ואפשר להמשיך מאיפה שהפסקנו.

בנוסף, עבודה עם פרוייקטים מיעלת את תהליך העבודה ב R בכך שהיא עוזרת לנו לשמור את כל המסמכים הרלוונטיים לפרוייקט במקום אחד - שכן כל פרוייקט משוייך לתיקייה מסוימת.

חשוב להדגיש שלא חייבים לעבוד עם פרוייקט, והכלי נועד רק על מנת לעזור לנו לעשות סדר בתהליך העבודה


תכולת פרוייקט

כשפותחים פרוייקט חדש נפתחת תיקייה חדשה המכילה את הקבצים הבאים:

  • קובץ פרויקט - בסיומת Rproj , שהיא בעצם רשימה המכילה מידע על תמונת המצב של הפרוייקט שלנו.
  • קובץ היסטריה - בסיומת Rhistory , המכיל את רשימת הפקודות שביצענו במהלך אותו פרוייקט.
  • קובץ נתונים - בסיומת RData , המכיל את תמונת המצב של ה envrionment שבה עבדנו - כולל אובייקטים (טבלאות, וקטורים, פונקציות, וכו’)
  • כל דבר אחר - רצוי לשמור את כל ה script ים ומסמכים אחרים הקשורים לפרוייקט בתיקיית הפרוייקט.

למעשה בפתיחת הפרוייקט רק הקובץ הראשון נפתח, אך לאחר שמירה ראשונה של הפרוייקט יתווספו שאר הקבצים.


יצירת פרוייקט חדש

אפשר לייצר פרוייקט חדש באחד משני דרכים:

  1. בעזרת ניתוב ל - File>>New Project
  2. בפינה הימנית למעלה בלחיצה על האיקון של פרוייקט

ניתן לפתוח פרוייקט קיים באחד משני דרכים:

  1. בעזרת ניתוב ל - File>>Open Project
  2. בפינה הימנית למעלה בלחיצה על האיקון של פרוייקט

אחרי שפותחים פרוייקט, תיקיית הבית שלנו (תיקיית ברירת המחדל של שמירת וחיפוש קבצים) מתעדכנת להיות תיקיית הפרוייקט.


תרגיל

  1. פתחו פרוייקט חדש בשם: CourseProject - הפרויקט ילווה אתכם במהלך הקורס.

עבודה עם Script

עבודה עם script ים מאפשרת לנו לשמור את הקוד שאנו כותבים ולבצע חלקים ממנו או את כולו עכשיו או בזמן מאוחר יותר.

במקרים בהן תהליך העבודה שלנו מורכב ממספר שלבים שונים, רצוי לחלק אותם למספר script ים שונים.

בנוסף מומלץ (לא חובה) ששמות ה script ים השונים יתחילו במספור ולאחר מכן שם הממחיש את מטרת ה script

לדוגמא:
01-Importing Data
02-Preprocessing Data
03-Summarizing Data


סוגי Script ים עיקריים

ב RSTUDIO יש כל מיני סוגי script - ים שאפשר לעבוד אתם, כאשר ההבדל בינהים הוא מבחינת סוג התיעוד שנרצה לתהליך העבודה.

למרות ההבדלים בין ה script ים , כולם בסופו של דבר הם קבצי טקסט רגילים שניתן לערוך מכל editor שנרצה.

ה Script ים העיקריים הם:

  • script R בסיסי - נשמר כמסמך טקסט עם הסיומת R.
  • rmarkdown - נשמר עם סיומת Rmd ומאפשר שמירת תהליך העבודה במגוון פורמים (word, pdf, html)
  • rnotebook - שדרוג של קובץ rmarkdown המאפשר תצוגה מקדימה של הפלט בתוך ה editor , ייצוא הקוד , ועוד
  • סקריפט ליצירת PDF - סקריפט מסוג rnw המתורגם כ LaTex.
  • סקריפט shiny - ליצירת אפליקציה אנטראקטיבי.
  • ועוד - יש מספר script ים נוספים המאפשרים יצירת מצגות, עריכת ספר, בניית אתר dashboard, ועוד.

יצירת Script חדש

ניתן ליצור script R חדש מכל אחד מהסוגים המוזכרים לעיל בשתי דרכים:

  • ניתוב ל File>>New File ובחירת סוג ה script הרצוי
  • לחיצה על האייקון השמאלי ביותר ליצירת script חדש

ניתן לפתוח script קיים בכמה מקומות:

  1. בעזרת ניתוב ל - File>>Open File
  2. באייקון השני משמאל לפתיחת קובץ
  3. לחיצה על שם הקובץ בטאב ה Files

שימוש ב script R בסיסי

ב script R בסיסי, כל שורה מתורגמת כקוד.

  • ניתן להריץ שורה אחת של קוד על ידי עמידה על השורה או סימון קטע קוד ושימוש בקיצור : Ctrl+Enter; או לחיצה על Run.
  • ניתן להריץ את כל הקוד על ידי הקיצור: Ctrl+Shift+Enter ; או לחיצה על Source.
  • שורה המתחילה ב # מסומנת כהערה.

תרגיל

  1. פתחו script R בסיסי חדש ושמרו אותו בשם Lesson1-basic.

  2. הוסיפו את הקטע קוד הבא:

print("hello world")
  1. כתבו בתוך הסקריפט את הקטע קוד הבא- הדוגם 10,000 תצפיות מהתפלגות נורמלית סטנדרטית ומייצרת היסטוגרמה שלהם:
hist(rnorm(10000))
  1. הריצו רק את הקוד משאלה 3. ואז הריצו את שתי קטעי הקוד בפעם אחת.

שימוש ב- rmarkdown

שפת ה markdown

ה script ים החדשים יותר מתבססים על שפת ה markdown לעריכת המסמך.

ב script של rmarkdown, השטח הלבן הוא קוד של markdown והשטח האפור מהווה קטעי קוד של R או chunks.

עיקרי שפת ה markdown הם:

  • כל מה שנכתב מתורגם כטקסט רגיל
  • תחילת שורה ב # מהווה כותרת ראשונה
  • תחילת שורה ב ## מהווה כותרת שניה , וכו’
  • תחילת שורה ב * יתורגם כ bullet
  • סימון מילה ב **text** יתורגם כ bold text
  • סימון מילה ב *text* יתורגם כ italic text

את שאר כללי ה markdown תוכלו לראות ב cheatsheet של markdown שתוכלו להוריד מ:

help>> Cheatsheets>> R Markdown Cheatsheet

הרצת קטע קוד

ניתן להוסיף קטע קוד של R בעזרת הקיצור: Ctrl+Alt+I ; או לחיצה על האייקון Insert

ניתן להריץ קטע קוד של R על ידי הקיצור : Ctrl+Shift+Enter ; או על ידי לחיצה על המשולש הירוק; או על ידי לחיצה על Run

שמירת פלט בפורמטים שונים

לאחר שמסיימים לערוך את מסמך ה Rmd ניתן ללחוץ על האייקון knit כדי לשמור את הפלט באחד הפורמטים (או במספר פורמטים בו זמנית): word, hmtl, או PDF.


תרגיל

  1. פתחו קובץ rmarkdown חדש ושמרו אותו בשם Lesson1-markdown

הקובץ נפתח עם template של קוד מוכן לריצה

  1. הריצו את ה chunk הראשון המתחיל בשורה 16.

  2. הריצו את ה chunk השני המתחיל בשורה 24.

  3. תוסיפו בסוף ה script קטע קוד של R המכיל את הקוד הבא:

head(iris)

הפקודה head מחזירה כפלט 5 שורות ראשונות של אובייקט יש מספר טבלאות מובנות ב R, אחד מהם הוא iris המכיל נתונים על כלניות הפקודה data מחזירה רשימה עם שמות טבלאות הנתונים הנמצאים בחבילה מסוימת

data(package= "datasets")
  1. לחצו על knitr והמירו את התוצאות לקובץ html.

קיצורי דרך שימושיים

להלן רשימה של קיצורי הדרך הכי שימושיים:

  • Ctrl+Enter : הרצת שורת קוד מסומנת
  • Ctrl+Shift+Enter : הרצת chunk של קוד
  • -Alt : כתיבת אופרטור השמה
  • Ctrl+Shift+M : כתיבת אופרטור שרשור
  • Ctrl+Shift+C : סימון שורה בתור הערה
  • Alt+Shift+K : קיצורי דרך
  • Ctrl+L : ניקוי הקונסול
  • F1 : קבלת עזרה על פקודה
  • tab : השלמה אוטומטית בזמן כתיבה

רשימה של כל קיצורי הדרך נמצאת ב : Tools - > Keyborad shortcut help