Obsah SekceO editoruÚdaje napříč federální vládou5Velká data v konečné pracovní skupině scieBig Data Interagency Working Group (IwoBig data to knowledge at nihRole velkých dat, strojového učení a dalších při posuzování rizik: regulační P(FTC ROPoskytuje redakce businesseResponderu) Zprávy: Velká data a veřejná bezpečnost Díky velkým datům jsme líní Skutečná výzva velkých dat
BioSense 20 je první systém, který bere v úvahu proveditelnost regionální koordinace pro informování o situaci veřejného zdraví prostřednictvím interoperabilní sítě systémů postavených na stávajících státních a místních schopnostech BioSense 2
0 odstraňuje mnoho nákladů spojených s monolitickou fyzickou architekturou a zároveň činí distribuované aspekty systeraparentní pro koncové uživatele a také zpřístupňuje data pro vhodné analýzy a síťovou fylogenomiku pro bakterie a ohnisko ID CDC Special Bogy ReferenceLaboratory (SBRL) identifikuje a klasifikuje neznámé bakteriální patogeny, detekce přetržení, Fylogenomika, srovnávací fylogenetická analýza celé genoryDNAnce, přinese koncept sekvenčně založené identifikace na zcela nový způsob identifikace štěňat umožní provedení vícenásobně se objevujících patogenů během několika hodin, spíše než dny nebo týdnyCenter for Medicare Medicaid Services (CMS) je vyvíjen datový sklad založený na Hadoop pro podporu analytických a reportovacích požadavků z programů Medicare a Medicaid Hlavním cílem je vyvinout podporovatelný, udržitelný a škálovatelný design, který pojme nashromážděná data na úrovních skladu náročný je vývoj řešení, které doplňuje stávající technologiepoužití databázových technologií XMl je vyhodnocováno tak, aby podporovaloranakční intenzivní prostředí pojištění vytěžuje procesy způsobilosti a přihlašování, databáze XML umožňují škálovatelná data velkých tabulek, biooptimalizovaná pro transakční výkony s daty administrativních nároků (Medicare) za účelem zlepšení rozhodování- tvorba: CMs má současnou sadu pilotních projektů s laboratořemi Oak Ridge National, které zahrnují hodnocení nástrojů pro vizualizaci dat, technologií platforem, možností uživatelského rozhraní a vysoce výkonných výpočetních technologií – zaměřených na používání administrativních údajů o nárocích (Medicare) k vytváření informačních produktů pro vedení a podpora lepšího rozhodování v různých programech CM s vysokou prioritou SPRÁVA DODÁVEK A DROG (FDA) Prostředí virtuální laboratoře (VLE) bude kombinovat stávající zdroje a schopnosti, které umožní virtuální laboratorní datovou síť, pokročilé analytické a statistické nástroje a schopnosti, hromadné získávání analytiky pro předvídání a podporovat veřejné zdraví, dokument
podpora správy, možnost tele-presence umožňující celosvětovou spolupráci a v podstatě udělejte z jakéhokoli místa virtuální laboratoř s pokročilými funkcemi během hodiny NÁRODNÍ ARCHIV Správa záznamů (naraThe Cyberinfrastructure for a Billion Electronic Records (CI-BER) je společná agentura sponzorovaná aplikace multiagenturní sponzorované kybernetické infrastruktury a formace nyní Počítačový institut Toto testovací prostředí bude vyhodnocovat technologické přístupy na podporu udržitelného přístupu k mimořádně rozsáhlým sbírkám dat. Ocenění NÁRODNÍ LETECKÁ VESMÍRNÁ SPRÁVA (NASA) SAs Advanced Information Systems Technology (AlST) usiluje o snížení rizika a nákladů na vyvíjející se informační systémy NASa pro podporu budoucích misí pro pozorování Země a pro transformaci pozorování na informace o Zemi, jak si to představuje nasas klimacentrická architektura Některé aIsgramy se snaží o využití možností velkých dat, aby se snížilo riziko, náklady a doba vývoje vesmírných a pozemních informačních systémů Divize Earth Science Division a zvýšit dostupnost a užitečnost vědeckých dat Projekt NASAS Vědecký datový a informační systém o Zemi (ESDIS), aktivní již více než 15 let, pracuje na zpracování, archivaci a distribuci družicových dat a dat vědy o Zemi z leteckých a terénních kampaní.
s důrazem na spokojenost uživatelů se snaží a veřejnost má přístup k datům, aby umožnila studium Země z vesmíru, aby bylo možné pokročit v systercii Země, aby bylo možné čelit výzvám změny klimatu a životního prostředí systémů (GEOSS) je společné mezinárodní úsilí o sdílení a integraci Země data pozorování, nasa spojila síly s americkou Agenturou pro ochranu životního prostředí (EPA), Národní správou oceánů a atmosféry (NOAA), dalšími agenturami a celostátními satelitními a pozemními monitorovacími a modelovacími systémy k vyhodnocení podmínek prostředí a předpovídání výsledků událostí, jako jsou požáry, růst populace a další vývoj, který je přirozený a vytvořený člověkem V dlouhodobém horizontu s akademickou obcí budou výzkumníci integrovat komplexní řadu informací o kvalitě ovzduší, aby lépe porozuměli a řešili dopad kvality ovzduší na životní prostředí a lidské zdraví. NASa a Cray, Inc, umožňuje spolupráci na jednom nebo více projektech zaměřených na vývoj a aplikaci „velkých datových systémů s nízkou latencí“ Projekt zejména testuje použitelnost hybridních počítačových systémů pomocí vysoce integrované non-sQL databáze jako prostředku. pro doručení dat pro urychlení provádění mazání a analýzy
NASAS Planetary Data System (PDS) je archiv datových produktů od NASa planetarymissions, který se stal základním zdrojem pro vědce z celého světa Všechny produkty vyrobené PDS jsou recenzované, dobře zdokumentované a snadno dostupné prostřednictvím systému online katalogů, které jsou organizovány planetárními obory. Multimisní archiv ve Space Telescope Science Institute (MAST), součást distribuovaných datových služeb pro vesmírnou vědu NASAS, podporuje a poskytuje astronomické komunitě různé archivy astronomických dat, s primárním zaměřením na vědecky podložené datové soubory v optické, ultrafialové a blízké infračervené části spektra MASThives andovide přístup k různým spektrálním a obrazovým datům The Earth System Grid Federation je veřejný archiv, od kterého se očekává, že bude podporovat výzkum, který je základem Páté hodnotící zprávy Mezinárodního panelu pro změny klimatu, která bude dokončena v roce 2014 (stejně jako u čtvrté hodnotící zprávy)
NASA přispívá jak pozorovacími daty, tak modelovým výstupem do federace prostřednictvím spolupráce s doeNATIONAL INSTITUTES OF HEALTH (NIH)Národním onkologickým institutem (ncile Cancer Imaging Archive (TCIA) je služba pro sdílení obrazových dat, která usnadňuje provoz v oblasti lékařské zobrazování TCia si klade za cíl zlepšit využití zobrazování v dnešním výzkumu a praxi rakoviny zvýšením účinnosti a reprodukovatelnosti zobrazování detekce a diagnostiky rakoviny, využíváním zobrazování k poskytování objektivního hodnocení terapeutické odezvy a nakonec umožněním vývoje zobrazovacích zdrojů, které povedou Klinický projekt dsupporte Cancer Genome Atlas (TCGA) je komplexní a koordinované úsilí urychlující pochopení molekulární podstaty rakoviny pomocí aplikací technologií genomeanalýzy, včetně rozsáhlého sekvenování genomu S rychlým rozvojem rozsáhlé genomové technologie projekt TCGa nashromáždí několik petabajtů nezpracovaných dat bNational Heart Lung and Blood Institute (NhlBi) Cardiovascular Research Grid (CVRG) a Integrating d:AnalAnonymization and Sharing (iDASH) jsou dva informační zdroje podporované nhlBi, které poskytují bezpečné ukládání dat, integraci a zdroje analýzy, které umožňují spolupráci. a zároveň minimalizuje zátěž pro uživatele Cvrg poskytuje zdroje pro kardiovaskulární výzkumnou komunitu ke sdílení dat a analytických nástrojů iDASH vede vývoj v technologii ochrany soukromí a podporuje integrované sdílení dat a analytické prostředí
Národní institut biomedicínského zobrazování a bioinženýrství (NIBIBThe Development and Launch of the Interoperable and Curated Nanomateriál Registry, vedený instituty tNIBIB za účelem vytvoření registru nanomateriálů, jehož primární funkce jsou konzistentní a spravované informace o biologických a environmentálních interakcích wecharakterizovaných nanomateriálů, as a také odkazy na související publikace, modelovací nástroje, výpočtové výsledky a výrobní pokyny Registr usnadňuje vytváření standardů a konzistentních informací o výrobě a charakterizaci nanomateriálů, stejně jako jejich biologickou interakci s internetovou sítí pro pacienty řízené sdílení lékařských snímků smlouva řeší proveditelnost sdílení snímků model pro testování, jak mohou nemocnice, zobrazovací centra a ordinace lékařů implementovat sdílení dokumentů mezi podniky pro přenos obrázků a obrazových zpráv Jako výzkumný zdroj pro komplexní fyziologické signály nabízí PhysioNet bezplatný webový přístup k velkým sbírkám zaznamenaných fyziologických signálů (Physio Bank) a související open source softwarePhysioToolkit) Každý měsíc používá PhysioNet asi 45 000 návštěvníků po celém světě, přičemž získává informace o 4dale Neuroimaging Information Tools and Resource Clearinghouse (NITRC) je plán NIH pro sdílení osvojovacích a enformatických nástrojů a neuroimagingových dat poskytováním přístupu, informací a fór pro interakci pro výzkumnou komunitu. V ornitRC je registrováno více než 450 softwarových nástrojů a datových sad, tato stránka zaznamenala od svého spuštění v roce 2007 více než 301 milionů návštěv. Extensible nong Archive Toolkit (XNAT) je otevřená informatická platforma vyvinutá Neuroinformatics Research Group na Washingtonské univerzitě a běžně používaná výzkumnými institucemi v okolí svět
Úkoly běžného managementu XNAT týkající se produktivity a zajištění kvality pro zobrazování a související data Zdroje výpočetní anatomie a vícerozměrného modelování Laboratoř Neuro Imaging v Los Angeles (LOND) uchovává databází, která obsahují zobrazovací data z několika modalitů, většinou různých forem MR a domácích zvířat, gerdata Alzheimerova choroba Neuroimaging Initiative (ADNi) je dobrým příkladem projektu, který shromažďuje data z akvizičních webů v USA, činí data anonymními, ukládá je do karantény, dokud není provedena kontrola kvality (často okamžitě) a poté je zpřístupňuje uživatelům ke stažení z celého světa v různých oblastech. Formáty Počítačem podporovaná funkční neurochirurgická databáze vyvíjí metody a techniky k Hlubokým mozkovým stimulátorům Ss) používaným k léčbě Parkinsonovy choroby a jiných pohybových poruch. Centrální databáze byla vyvinuta na Vanderbilt University (VU), která spolupracuje s Ohio State and Wake
Vzhledem k tomu, že se klinický pracovní postup a tereotaktické rámce v různých nemocnicích mohou lišit, byl software pro chirurgické plánování aktualizován a úspěšně konsorcium NIH Biomedical Information Science and Technology Initiative (BISTI) se již více než deset let připojilo k institutům a centrům v NIh, aby propagovalo národy researiomedicínská informatika a výpočetní biologie (biCE, podpořila řadu programových oznámení a financovala více než miliardu dolarů na výzkum Kromě toho spolupráce podpořila aktivity v rámci NIH, jako je přijetí moderních postupů sdílení dat a softwaru, aby byly výsledky výzkumu náležitě šířeny do research communNIH BlueprintFramework (NF) je řada webových neurovědeckých zdrojů: data, materiály a nástroje přístupné přes jakýkoli počítač připojený k internetu Aof nih bnt for neurosResearchNIF posouvá pokroky ve výzkumu neurovědy tím, že umožňuje objevování a přístup k veřejným výzkumným datům a nástrojům po celém světě prostřednictvím otevřeného síťového prostředí Projekt NIH Human Connectome je ambiciózní snahou zmapovat nervové dráhy, které jsou základem funkce lidského mozku, a sdílet data o strukturální a funkční konektivitě. lidský mozek Projekt povede k velkému pokroku v našem chápání toho, co z nás dělá jedinečného člověka, a připraví půdu pro budoucí studie abnormálních mozkových okruhů u mnoha neurologických a psychiatrických poruch Společný fond NIHNárodní centra pro biomedicínské výpočty (NCBC) mají být součástí národní infrastruktury v biomedicínské informatice a počítačové biologii Osm center vytváří inovativní softwarové programy a další nástroje, které umožňují biomedicínské komunitě integrovat, analyzovat, modelovat a sdílet data o lidském zdraví a nemocech. flexibilní, přesné a citlivé nástroje pro hodnocení, které měří stav hlášený pacientem, hlavním zdrojem jsou nástroje assessment centra a databáze, která pomáhá výzkumníkům shromažďovat, ukládat a analyzovat data související se zdravotním stavem pacientůNatif všeobecné lékařské vědy
Models of Infectious Disease Agent Study (MiDAs) je snaha vyvinout výpočetní a analytické přístupy pro rychlou integraci informací o infekčních chorobách a poskytování informací musí být také jemné, s potřebami pro přístup k datům, správu, analýzu a výsledky modelování pro tvůrce politik. na místní, státní, národní a celosvětové úrovni, zatímco data, která mají být shromažďována a integrována globálně, protože jsou implementovány politiky veřejného zdraví, místní strukturální genomická iniciativa posouvá objevování a šíření trojrozměrných struktur proteinů, RNA a dalších biologických makromolekul představujících celou řadu strukturních rozmanitost nalezená v přírodě pro usnadnění základního porozumění biologii, zemědělství a medicíně Celosvětové úsilí zahrnuje iniciativu NId fundedtein Structure Strukturální genomická centra pro infekční nemoci StructuStockholm a riken Systems and strukturální biologie Centapan
Tyto snahy koordinují výběr sekvenčních cílů prostřednictvím centrální databáze. Cílová databáze, která je umístěna ve Structural Biology KnowledgebaseWorld Wide Protein Data Bank (wwPDB), úložiště pro sběr, archivaci a bezplatnou distribuci vysoce kvalitní makrostrukturální denní báze, představuje přední zdroj experimentálně určené makromolekulární struktury informační výzkum a výuka v biologii, biologické chemii a medicíně Složka projektu pro USA (RCSB PDB) je společně financována pěti instituty NIhDOE/BER a NSF a také účastníky ve Velké Británii a Japonsku. Jediná databanka nyní obsahuje experimentální struktury a související anotace pro 80 000 makromolekulárních strukturWebové stránky obdrží 211 000 unikátních návštěvníků měsíčně ze 140 různých zemí Z webu se každý měsíc přenese přibližně jeden bajt dat. , softwarově založený frameworksearch teto sdílí obrovské množství dat - rychleI soukromě - napříč geografickými vzdálenostmi a/nebo nekompatibilními výpočetními systémy, sloužící různým výzkumným komunitámNárodní knihovna medicinformatics pro integraci biologie a lůžka (i2b2), hledá vytvoření nástrojů a zdravotnictví a biomedicínský výzkum Softwarové nástroje foting data, která byla vyvinuta 12b2, jsou používána ve více než 50 organizacích po celém světě prostřednictvím open
Office of Behavioral and Social Sciences (OBSSR) Program National Archive of Computerized Data on Aging (NACDA) podporuje výzkum tím, že pomáhá výzkumníkům těžit z nedostatečně využívaného potenciálu široké škály datových souborů, které NACD uchovává a zpřístupňuje ty největší Knihovna elektronických dat ve Spojených státech Sdílení dat pro demografický výzkum (DSDR) poskytuje archivaci dat, jejich šíření a další služby datové infrastruktury DSDR pracuje na jednotném právně-technickém a věcném rámci, ve kterém lze sdílet výzkumná data v populačních vědách Společný program NihnSf Společný výzkum v Computational Neuroscience (CRCNS) není programem NIh-NsF na podporu společných výzkumných projektů mezi počítačovými vědci a mechanismy, které jsou základem poruch nervového systému a výpočetních strategií, které používají neurovědci, kteří posílí porozumění struktuře nervového systému a funkčně nervovému systému V posledních letech německé spolkové ministerstvo Vzdělávání a výzkum se také zapojil do programu a podpořil výzkum v německuNATIONAL SCIENCE FOUNDATION (NSF)C
ore Techniques and Technologies for Advancing Big Data Science Engineering (BIGDATA)een NSf and nih, jehož cílem je posunout základní vědecké a technologické prostředky správy, analýzy, vizualizace a extrahování užitečných informací z různých, distribuovaných a heterogenních souborů datKonkrétně bude podporovat vývoj a hodnocení technologií a nástrojů pro sběr a správu dat, datovou spolupráci, která umožní průlomové objevy a inovace ve vědě, strojírenství a medicíně a položí základy pro koordinaci USCyberinfrlidates a pokročilé kybernetické infrastruktury napříč NSF. smysluplnou kybernetickou infrastrukturu, stejně jako vyvinout úroveň grace a interoperability a nástroje na podporu vědy a vzdělávání CIF2I TrackGERT NSf sdílí se svou komunitou plány na zřízení nové CIFtrack v rámci svého programu Integrative Graduate Education and Research Traineeship (IGERT) Tato trať má za cíl vzdělávat a podporovat novou generaci výzkumných pracovníků schopných oslovit
O redaktoroviMichael Erbschloe pracoval více než 30 let na analýze ekonomiky informačních technologií, veřejné politiky týkající se technologií a využívání technologií v reengineeringových organizačních procesech Je autorem několika knih o sociálních a manažerských otázkách informačních technologií, které vydal Mc Graw Hill a další významní nakladatelé Vyučoval také na několika univerzitách a vytvořil učební osnovy související s technologiemi
Jeho kariéra se soustředila na několik vzájemně propojených oblastí Technologická strategie, analýza a prognózyVýuka a vývoj učebních osnov a článkyPublikování a publikování analýzy veřejné politiky a hodnocení programůKnihy od michaela erbschloe Úroveň ohrožení červená: Výzkumné programy kybernetické bezpečnosti vlády USA(CRC Press)Válka v sociálních médiích: Přístup ke zlepšení organizace pro všechny(Publikace auerbach)Zabezpečení(Publikace Auerbach)Fyzické zabezpečení pro IT(Elsevier SciTrojans, Worms a Spyware(Butterworth-Heinemann)Implementace vnitřní bezpečnosti v podniku IT(Digitální tisk)Příručka k obnově po havárii(Technologie kurzuSpolečensky odpovědná Správa IT (Digital PressInformation Warfare: Jak přežít kybernetické útoky (McGraw Hill) Příručka výkonného ředitele pro správu soukromí (McGraw Hill) Soukromí na síti: Průvodce rozvojem implementace plánu ochrany osobních údajů e-bl (McGraw Hill)
ÚvodV březnu 2012 oznámila Obamova administrativa iniciativu „Big Data Research and DevelopmentInitiative Zlepšením schopnosti extradovat a poznatků z velkých a shluků digitálních dat, tato iniciativa slibuje, že pomůže urychlit tempo objevování a inženýrství, posílí naši národní bezpečnost, a transformovat výuku a učení v nové závazky, které společně slibují výrazné zlepšení nástrojů a technik lcde oo zahájilo iniciativu, šest federálních ministerstev a agentur oznámilo přístup, organizování a shromažďování objevů z obrovských objemů digitálních dat za více než 200 milionů dolarů. již sponzoruje výzkum týkající se velkých dat a univerzitní výzkum
Univerzity začínají vytvářet nové kurzy – a celé kurzy Data withoutBorders pomáhají bezpředmětnému pro bono sběru, analýze a vizualizaci dat OSTP by měl velký zájem podpořit vytvoření fóra, které by upozornilo na nová partnerství veřejného a soukromého sektoru související s Velká data
Velká data napříč federální vládou 29. března 2012Níže jsou uvedeny hlavní body probíhajících federálních vládních programů, které se zabývají výzvami revoluce velkých dat a využívají příležitostí, které přináší revoluce velkých dat, k pokroku v misích agentur a dalších vědeckých objevech a inovacích ODDĚLENÍ OBRANY (DODData to Decisions : Ministerstvo obrany (DOD) „velikou sázku na velká data, investuje 250 milionů dolarů ročně (s 60 miliony dostupnými na nové výzkumné projekty) napříč vojenskými ministerstvy do řady programů, které budou využívat a využívat masivní data novými způsoby a spojuje podporu snímání, vnímání a rozhodování, aby vytvořily skutečně autonomní systémy, které dokážou manévrovat a rozhodovat o operacích, katedra hledá 100násobnou schopnost informací z textů v jakémkoli jazyce a podobný nárůst počtu objektových aktivit a události, které může analytik pozorovat Velká data, která splňují tyto a další rets, dod vyhlásí řadu otevřených soutěží o ceny v průběhu příštích několika měsíců AGENTURA PRO POKROČILÉ VÝZKUMNÉ PROJEKTY PRO OBRANU (program DARPAtectionle Scales (ADAM) se zabývá problematikou detekce nomálií a characdata jsou určena ke sběru podnětů další, použitelné informace v široké škále kontextů reálného světa
Aplikace TADAMS domainder – detekce hrozeb detekce hrozeb jednotlivce na pozadí rutinní sítě Program Cyber-Insider Threat (CINDER) se snaží vyvinout nové přístupy k detekční činnosti v souladu s kybernetickou špionáží ve vojenských počítačových sítích Jako prostředek k odhalení skrytých operací , CINDER použije různé modely protivníkanormálního
Aktivita na interních sítích CINDER si také klade za cíl zvýšit přesnost, rychlost a rychlost, s jakou jsou kybernetické hrozby detekovány. Program Insight řeší klíčové nedostatky v současných zpravodajských, sledovacích a průzkumných systémech Automatizace aImachine uvažování umožňuje operátorům analyzovat větší počet potenciálních hrozeb před citlivými situacemi Insightprogram si klade za cíl vyvinout systém řízení zdrojů, který automaticky identifikuje sítě hrozeb a nepravidelné válečné operace prostřednictvím analýzy informací ze zobrazovacích a nezobrazovacích senzorů a dalších zdrojů Programy strojového čtení pro realizaci umělých inteliplikací vývojem výukových systémů, které zpracovávají přirozený text a vkládají výslednou sémantickou reprezentaci. do znalostní základní a časově znalostní reprezentace vyžaduje odborníky a přidružené znalostní inženýry k ručnímu řemeslu Program pro oko se snaží vyvinout schopnost „vizuální inteligence“ ve strojích, zatímco tradiční studium strojového vidění pokročilo v rozpoznávání široké škály objektů a jejich vlastností – co by mohlo být chápán jako podstatná jména v popisu ascene-Oko mysli se snaží přidat percepční a kognitivní základy potřebné pro rozpoznání a uvažování o slovesech v těchto scénách
Tyto technologie mohou společně vytvářet vizuální příběh. Program Resilient Clouds orientovaný na úkoly se zaměřuje na řešení bezpečnostních problémů souvisejících s výpočetní technikou vývojem technologií pro detekci, diagnostiku a reakci na útoky, efektivním budováním „komunitního zdravotního systému“ pro cloud Program také si klade za cíl vyvinout technologie, které umožní cloudovým aplikacím a infrastruktuře pokračovat ve funkčních hostitelích a úkolech v rámci cloudového souboru, které by se mohly stát hlavní výzvou pro zabezpečení informací v prostředí cloudu, a to rozvojem praktických metod a souvisejících moderních programovacích jazyků pro výpočty. ondata, která se po celou dobu šifrovala, kdyby je nejprve dešifrovali, měli by protivníci obtížnější čas zachytit video dat a nástroj pro získávání a analýzu obrázků (virat), jehož cílem je vyvinout systém, který poskytne vojenským analytikům snímků schopnost využít množství shromážděných režijních nákladů, které IfviRaT umožní. anal-tablish poplachové aktivity a zajímavé události, jakmile k nim dojde VIRAT se také snaží vyvinout nástroje, které by analytikům umožnili rychle načítat, s vysokou přesností a vybavováním, video obsah z extrémně velkých videoték.
Program XDATA se snaží vyvinout výpočetní techniky a softwarovou analýzu velkých objemů polostrukturovaných a nestrukturovaných dat Mezi hlavní výzvy, které je třeba řešit, patří škálovatelné algoritmy pro zpracování nedokonalých dat v distribuovaných datových úložištích a účinné nástroje pro interakci člověka s počítačem, které lze rychle přizpůsobit, aby usnadnily vizuální uvažování pro různorodé mise
Program si představuje sady nástrojů s otevřeným zdrojovým kódem pro flexibilní software pro odstraňování velkých objemů dat cílené odložení aplikace ODDĚLENÍ VNITŘNÍ BEZPEČNOSTI (DHS) Centrum excelence pro vizualizaci a analýzu dat (CVADA), spolupráci mezi výzkumníky z Rutgers University a Purdue University (se třemi každá z dalších partnerských univerzit) vede výzkumné úsilí na velkých, heterogenních datech, která by první respondenti mohli využít k řešení problémů od člověkem způsobených nebo přírodních katastrof až po teroristické incidenty; vymáhání práva v zájmu bezpečnosti hranic; a výbušnin proti kybernetickým hrozbám ODDĚLENÍ ENERGIE (DOE) Kancelář pokročilého vědeckého výpočetního výzkumu (AVCR) poskytuje vedení komunitám pro správu, vizualizaci a analýzu dat včetně digitální ochrany a přístupu k komunitě Programy v rámci sady zahrnují široce používané technologie správy dat, jako je vědecký pracovní postup Kepler Systém; a standard Storage Resource Management; rozmanitost dat storageent techch as bestman the bulk data me Adaptable IO System (ADIOS); Technologie pro indexování dat FastBit (používá Yahoo!) a dvě High Performance Storage System (HPS) je software, který spravuje petabajty dat na discích a robotické páskové systémy HPSS, vyvinuté společnostmi doE a iBM se vstupními laboratořemi po celém světě, používají digitální knihovny, obranné aplikace a řada oborů včetně nanotechnologie, jaderné fyziky, výpočetní dynamiky tekutin, vědy o klimatu atd., stejně jako Northrop grumman, NASA a knihovna CongressMathematics pro analýzu dat petascale řeší matematické problémy extravhledů z obrovských vědeckých datových souborů a hledání klíčových vlastnosti a pochopení vztahů mezi těmito funkcemi Oblasti výzkumu zahrnují strojové učení, analýzu streamovaných dat v reálném čase, techniky stochastické nelineární redukce dat a škálovatelné techniky statistické analýzy použitelné pro širokou škálu aplikací DOE, včetně dat ze senzorů
Program Next Generation Networking podporuje nástroje, které umožňují výzkumné spolupráci při hledání, přesunu a používání velkých dat: od projektu globus Middleware v roce 2001 přes protokol pro přenos dat gridFTP v roce 2003 až po Earth Systems Grid (EsG) v roce 2007 Dnes, Servery GridFTP přesouvají více než 1 petabajt vědeckých dat za měsíc pro Open Science Grid, ESG a Biology, což bylo také využito spoluprací olejů Texd k výcviku studentů nejmodernějších metod ropného inženýrství a integrovaných pracovních postupů v oboru Basic Energy Sciences (BESBES Scientific Uživatelská zařízení podpořila řadu snah zaměřených na pomoc uživatelům se správou dat a analýzou velkých dat, která mohou být velká jako yerabajty (10 12 bajtů) datového dne z jednoho experimentu, například Accelerating Data Acquisition, Reductionnd Analysis( Projekt ADARA se zabývá potřebami datového toku při rozkládání NeutronCoherent X-ray Imaging Data Bank byla vytvořena za účelem maximalizace dostupnosti dat a efektivního využití synchrotronových zdrojů dat a komunikace na workshopu Basic Energy Sciences v říjnu 201Sponzoroval jsem ES a AV ČR identifikované potřeby v experimentálních datech, které by mohly ovlivnit pokrok vědeckých objevů
Program biologického a environmentálního výzkumu (BER), Atmospheric Radiationmeasurement (ARM) Clins multiplatformní vědecké uživatelské zařízení, které poskytuje infrastrukturu mezinárodní komunity pro získávání klíčových atmosférických jevů potřebných pro pokrok v porozumění atmosférickým procesům a jsou k dispozici data z ramen klimatických modelů a používá se jako zdroj pro více než 100 odborných článků ročně Výzvy spojené se shromažďováním a prezentací informací o vysokém časovém rozlišení a spektrálních informacích ze stovek přístrojů se řeší, abychom splnili Systems BKnowledgebase (Kbase) je komunitou řízený softwarový rámec umožňující datově řízené předpovědi mikrobiálních, funkce rostlin a biologické komunity v kontextu prostředí, kbase byla vyvinuta s otevřeným designem pro zlepšení efektivnosti vývoje algoritmů a nasazení a pro přístup a integraci experimentálních dat z heterogenních zdrojů Kbase není typickou pasáží, ale prostředkem k interpretaci chybějících The Office of Fusion Energy Sciences (FES)
Partnerství Scientific Discovery through Advanced Computing (SciDAC) mezi FES a kanceláří Advanced Scientific Computing Research (ASCR) řeší problémy s velkými daty spojené s výpočetním a experimentálním výzkumem ve vědě o energii z jaderné syntézy Technologie správy dat vyvinuté partnerstvími ASCr-FES zahrnují vysoký výkon /výstupní systémy, pokročilé vědecké pracovní postupy a rámce provenience a potřeby v oblasti techniky vizualizace, které přilákaly evropské integrované modelovací úsilí a ITER, mezinárodní výzkum jaderné fúze a Úřad pro fyziku vysokých energií (HEP) Program Computational High Energy Physics Program podporuje výzkum pro analýzu rozsáhlé soubory experimentálních dat a také velké objemy simulovaných dat – podnik, který obvykle vyžaduje globální úsilí stovek vědců
Mezi společné projekty správy velkých dat patří PanDA (Produkce a distribuovaná analýza) Správa pracovní zátěže Systenand XRootD, vysoce výkonný software odolný proti chybám pro rychlý a škálovatelný přístup k datovým úložištím mnoha druhů úřadu Nuclear Physics (NP) The US Nuclear Data Program( USNDP) je vícemístný projekt zahrnující sedm národních laboratoří a univerzit, který udržuje a poskytuje přístup k rozsáhlým specializovaným databázím spanningysics, které kompilují a kontrolují všechny důležité eon důležité vlastnosti jaderného Úřadu pro vědecké a technické informace (OSTIOSTI, jediný federální úřad USA). člen agentury Data Cite (celosvětové konsorcium předních vědeckých a technických informací o technikách citování dat, které umožňuje efektivní opětovné použití aerifikace dat tak, aby bylo možné sledovat dopad dat, a může být vytvořena struktura, která rozpoznává a odměňuje producenty dat ODDĚLENÍ ZÁLEŽITOSTI VETERÁNŮ (VA)
Konsorcium pro výzkum zdravotnické informatiky (Chir) vyvíjí nástroje Natural Language Processin (NLP), aby zpřístupnilo obrovské množství informací, které jsou v současnosti uloženy ve Va as (Pro Watch: Ve va probíhá úsilí o vytvoření transparentních, reprodukovatelných a reusabletware pro sledování různých událostí souvisejících s bezpečností Pro Watch je program sledování založený na výzkumu, který se opírá o nově vyvinuté informační zdroje k detekci, sledování a měření zdravotních stavů spojených s vojenským nasazením AVivA je pracovní lidský systém nové generace Vas, který bude databáze z podnikových aplikací az uživatelské rozhraní založené na prohlížeči
Analytické nástroje se již staví na základě pro výzkum a podporu rozhodování při setkání s pacienty. Projekt pozorovacích lékařských výsledků je navržen tak, aby porovnával platnost, proveditelnost a výkonnost analytických metod bezpečnostního dohledu. Corporate Data Warehouse (CDw) je program pro organizaci s dodáním do cíle péče o úplný přehled o nemoci a léčbě u jednotlivců a populací Úložiště zdravotních dat standardizuje terminologii a formát dat mezi poskytovateli zdravotní péče a zejména mezi Va a dOD, což umožňuje Cdw integrovat dataGenomický informační systém pro Inciencecare pro veterány prostřednictvím personalizované medicíny GenISI konsorcium slouží pro klinické studie s přístupem k elektronickým zdravotním záznamům a genetickým datům, aby mohly být prováděny klinické studie, genomické studie a studie výsledků napříč Valillian Veteran Program získává dobrovolné příspěvky vzorků od veteránů foenotypior konsorcia genisis a budou připisovány „fenotypu“ " ve zdravotních záznamech jednotlivých veteránů pro understato dVA Information and Computing Infrastructure poskytuje analytický pracovní prostor a analýzu velkých datových sad, které jsou nyní dostupné ve VA, a podporuje společný výzkum odkudkoli ze sítě Va HEALTH AND HUMAN SERVICES (HHSDisease Control Prevention (CDC)