Datensätze für r downloaden

Bisher haben wir eine zuvor vorbereitete SQLite-Datenbank verwendet. Wir können aber auch R verwenden, um eine neue Datenbank zu erstellen, z.B. aus vorhandenen csv-Dateien. Erstellen wir die Säugetierdatenbank, mit der wir gearbeitet haben, in R neu. Lassen Sie uns zuerst die csv-Dateien herunterladen und lesen. Wir importieren tidyverse, um Zugriff auf die read_csv() Funktion zu erhalten. Da plot_id in beiden Tabellen aufgeführt ist, können wir sie verwenden, um übereinstimmende Datensätze nachzuschlagen und die beiden Tabellen zu verknüpfen. Noch besser ist, dass viele große Datensätze bereits in öffentlichen oder privaten Datenbanken verfügbar sind. Sie können sie abfragen, ohne die Daten zuerst herunterladen zu müssen. Die rgbif-Bibliothek enthält eine Funktion, gbif_citation, die Ihnen hilft, die von GBIF heruntergeladenen Daten richtig zu zitieren. Übergeben Sie einfach einen einzelnen Vorkommensschlüssel, einen Datasetschlüssel, die Ergebnisse eines Aufrufs an die occ_search oder occ_download_get Funktionen. Die SQLite-Datenbank ist in einer einzigen Datei portal_mammals.sqlite enthalten, die Sie während der SQL-Lektion generiert haben. Wenn Sie es nicht haben, können Sie es von Figshare in das unterverzeichnis data_raw herunterladen, indem Sie: Wenn nichts passiert, GitHub Desktop herunterladen und es erneut versuchen.

Die vollständige Funktionalität wird im rgbif-Tutorial beschrieben. Das rgbif-Paket ist auch Teil der SPOCC Species Occurrence Data-Suite, die Zugriff auf Vorkommensdatensätze aus mehreren Datenbanken bietet. Diese Antwort wird auch einzelne Zitate von beitragenden Datensätzen enthalten, jedoch wird das obige Zitat, das das DOI enthält, Verweise auf jedes dieser Datensätze enthalten, einschließlich Informationen darüber, welche spezifischen Vorkommen in den Download aufgenommen wurden. Automatisierung: Glänzende Apps verwenden häufig Daten, die sich im Laufe der Zeit ändern: Aktienkurse, Sensorwerte, zentralisierte Datenbanken usw. Indem Sie Benutzern reproduzierbaren R-Code zur Verfügung stellen, ermöglichen Sie es ihnen, diese Logik in andere Workflows zu integrieren, z. B. das Erstellen einer regelmäßigen R Markdown-E-Mail mit RStudio Connect (z. B.

wurde der r.a. von der oben genannten Shiny-App generierte R-Code so zugeschnitten, dass jeder den Code erneut ausführen kann, um die neuesten Download-Statistiken zu erhalten). Release-Versionen von Audio kann von CRAN erhalten werden – in der Regel install.packages(« audio ») in R wird den Trick tun. Die aktuelle Entwicklungsversion kann aus dem Dateibereich heruntergeladen werden. Beständigkeit: Die Verwendung einer Shiny-App kann ein flüchtiges Gefühl haben; Was passiert in Zukunft, wenn der Server ausfällt oder sich die Funktionen der App ändern? Mit einem reproduzierbaren Bericht können Ihre Benutzer ein dauerhafteres Artefakt herunterladen, das lokal gespeichert werden kann. Dokumentation: Diese ist besonders relevant für explorative Analyse-Apps, mit denen Sie Erkenntnisse aus einem Datensatz gewinnen können. Ein gutes Beispiel ist die ANOVA-Beispiel-App in der Fallstudien-Vignette, in der Sie ein Dataset hochladen, eine ANOVA-Analyse ausführen und dann einen Bericht mit allen ANOVA-Ergebnissen sowie dem Code zum Reproduzieren herunterladen können. Unten ist eine Bildschirmaufzeichnung einer Shiny-App, mit der Sie CRAN-Download-Statistiken für jede Kombination von CRAN-Paketen abrufen, diese Downloads mit verschiedenen Aggregationen betrachten und einen Rmd-basierten Bericht mit Code erstellen können, um die Visualisierung zu reproduzieren. Diese Shiny-App unterscheidet sich von den meisten, da sie R-Code generiert, um zu reproduzieren, was der Benutzer in der Shiny-App sieht (d. h., beachten Sie, wie der generierte Bericht die Eingabe des Benutzers widerspiegelt). Wie viele Funktionen in rgbif können Sie wählen, was mit dem Return-Parameter zurückgegeben werden soll, hier, nur die Metadaten zurückgeben: Bisher haben wir uns mit kleinen Datensätzen beschäftigt, die leicht in den Speicher Ihres Computers passen.

Aber was ist mit Datasets, die zu groß sind, als dass Ihr Computer als Ganzes behandelt werden könnte? In diesem Fall ist es hilfreich, die Daten außerhalb von R zu speichern und in einer Datenbank zu organisieren. Durch das Herstellen einer Verbindung mit der Datenbank können Sie nur die für die aktuelle Analyse erforderlichen Blöcke abrufen.

Ce contenu a été publié le Non classé par roullier. Mettez-le en favori avec son permalien.

Warning: count(): Parameter must be an array or an object that implements Countable in /homepages/6/d293095390/htdocs/hebergement/elevage-roullier/wp-includes/class-wp-comment-query.php on line 405

Les commentaires sont fermés.