The Nameless City

何故か製薬やSAS関連のブログ、の予定。

システムは生物です。消費期限があります。

古いシステムを騙し騙し使う、というのは、実際とてもコストがかかる事が多いのですが。 ほぼほぼその辺りの話は全てお話しているハズなんですが、「聞いてない」というお客さんは多いです。 どんなシステムも、バージョンアップで見た目とか挙動とか変わり…

SASインストール時に、アンチウィルスソフトは「絶対に」止めましょう。死ぬほど暇ならいいですが。

SASインストールのお話ですが。 SASのサーバコンポーネント、jarファイル多いんですが、アンチウィルスソフトによって内部をサーチされる時に、異様に時間がかかります。 今の所、インストールに失敗するケースはありませんが、人間が音を上げるくらい時間が…

CentOS on VirtualBox、のスマートな利用方法

という辺りで詰まってますなー。 Proxy Settingはグダグダながら何とか設定した事にした。 GNOMEでのSETTINGもしましたが。 sudoでもENVKEEP設定もしましたが。 結局の所、dconfだったかが、「接続出来ませんねん」みたいなメッセージを出して来る、あの問題…

会社もグループでもやる気がない感じなのが、もうなんてーかな。

コア数とかSSDとかに大して興味はないんですが、ビッグデータ解析にもマイナス評価なんですが、ベイズ解析とかがガンガン出来る環境上で、SAS構築するのはしたいなと思ってはいるんですよね。 今、単純にマシンスペック入れるだけでは性能が大して上がらない…

SASという製品を「1個」買う、という事はまず出来ないので。

SASですが。 「Analytics Pro」であるとか、そういう名前でご指定下さい。マジで。 SAS V8以降、SASのライセンスの呼び方や体系が変わってるんです。 現在、サーバに入れるSASの場合、通常はSAS Enterprise GuideやSAS Studio経由でアクセスするもの、という…

SASでのトランスエンコーディングあれこれ。

トランスエンコーディングは、大抵の場合、データセットの別環境への移送も含みます。 ので、そこら辺も絡めてちょっと言及しておきます。 前振りとして。 SASの文字変数は、固定長文字列としてバイト長で定義されています。その為、トランスエンコーディン…

XPORTファイルとは何ぞやというお話。

何だか騒がしくなってきた所ですが(超白々しい)、最近話題のSAS transport fileというのを簡単にご説明させて頂きます。 マニュアル(日本語) SAS 9.4 ファイルの移動とアクセス(PDF)をご参照下さい。 もうそこに書いてる事です。 全ての人に言います。 1…

VMWareが面倒臭くなったのでVirtualBoxを試す

VirtualBoxが気にはなってたけど、今までWin7でインストール出来ずに四苦八苦していたけど、とりあえずインストールする方法が見つかったので乗り換えてみる。 Virtual Boxのインストールの要諦。 Windows 7 Professionalではなんでかx32版をインストーラー…

SASのHELPが日本語化されると自分の仕事もちょっとは減ると思ったのだけど、未だに減らない件

おかしい。 あと、問題を難しく解こうとする人が多過ぎる。 SASは問題をSQL的に解くことも出来るし、関数使って解くことも出来る。が、得意ではない。 また、使えるのがいいとも限らない。完全外部結合を扱えるSQLだが、そんな結合はプログラム上使うシーン…

EXPORTプロシージャを使わないCSVの出力方法。

EXPORTプロシージャを使ってCSVを出力するのも間違いではないが、EXPORTプロシージャ内でも同様のSASプログラムを生成しているので、それに合わせて簡易なプログラムを作ってみた。 サンプルであり、マクロ化はしていないけど、マクロ化も難しい話ではない。…

倍精度浮動小数点型の限界はあるよ、という話。

データステップ100万回 SAS新手一生: マクロ変数に数値をいれて戻すと誤差がでちゃう場合がある問題について考える話を見て。 しばしば、お客さんに説明しても理解してもらえないので超絶面倒臭い話の周りになるんですがね。 確かぼんやりとした記憶ですが、…

SASプログラムを特定ファイルに展開して実行する方法

前のエントリのコメント欄で希望のあった、 call executeについても、わかりにくいですね。putでコード生成して、%includeで実行って方法、聞いたことはありましたが、まだ自分でやったことはありませんでした。ぜひコード例を紹介していただけたら嬉しいで…

SAS On CentOS手順作成

やってると本当に誰得な感じになっております(現在進行形)。 クライアントHyper-Vの取り扱いがスゲー面倒臭い。 ああ、個人的には、SAS Serverを作るなら、Windowsをオススメします。 Cent OSが面倒とかそういう話ではなくて、RHELとかよりはずっとWindows…

SASマクロプログラムの要諦

ネット見てると、SASプログラマーも数えるほどだけどそれなりにいるという事で、昔に比べて色々あるんだけど。 SASマクロ関数でのクォート処理は面倒な部類に入るのでマクロ言語でやるよりdataステップでマクロ変数を読み込む方法とかを使う方が幸せになれま…

何故、統計解析という言葉で、何か大それた事をしているようになるんだろう。

Big Data Analysisが悪いというわけじゃないんだが。 いい加減、どんな手法使うかってより、一体何を考慮したかの方が重視されないものかな。 変な話、 y=f(x1,x2,x3,x4,x5,x6....) という数式を近似解で解いてくやり方なのよね、統計って。 頼むから、統計…

現時点の予定(追加分)

FDAのサイト読解 面倒だが結局読む必要あるかー。 社内向けSDTM開設 この手のスライド資料は、いつかメモ書きから清書する、だけで作れるような仕組みにしたいなあ。 TerminologyのPersonal Dictionary化 Terminologyの取り込み、管理、辞書展開というのまで…

現時点の今後の予定。

現時点での今後の予定は以下。 Terminologyの構造化 現時点で提供されているTerminologyは、正直色々な所で使い勝手に難があるので、改造がてら、出来れば、更新通知の機械化等も含め考えたい。 ODM XML解読 しかし、なんかelement定義が中途半端にXMLな感じ…