The Nameless City

何故か製薬やSAS関連のブログ、の予定。

Non-parametricな手法とParametricな手法の分岐パターンって、本当に必要なの?

正直な所、そう思っている。 Non-parametricな手法であるべきかParametricな手法であるべきか、なーんてのは、実施する測定値や前提で決まってるんじゃないの? ってねえ。 その分岐に使われるのが、ひたすら等分散性の検定での判定だったりすることもあって…

Windowsでレジストリをいじって右クリックメニューに適当にS-JISでのバッチ実行用メニューを追加する。

こんな感じ。 改造元は、SAS9.4かで出て来ている、UTF-8でのバッチ実行のを見てです。まあ、要は拡張子連動の所で、明示的にコマンドを書いて上げるのです。 一応レジストリをなぶるので自己責任でどうぞ、とはいうけど、これぐらいはいじれるようになってた…

多分ググったら出てきたんだろうなあ・・・・・・

職場の人と話してた時に「その話ネットで見た」みたいに言われたんですが。 それ多分私のブログです。 職場ではイチイチ言ってませんが。 ま、そんなものです。 先代の人からそんなんでしたが(会社の人には知られていないが外部からは見える、みたいな)、 …

SASの最新環境への対応の遅さがそろそろキツイ。

SAS on Linuxを色々試しているのだけど、今の時代において 「UTF-8はフルサポート出来てません」 というのはホント如何なものかとは思う。 プロセス自体は対応出来ていても、DMSの対応が遅れているだとか、ホント困るんだが。 コアプロセスのイメージが更新…

LinuxでのPython環境構築について

Win7/VboxでFedoraでPythonでも、とかやっていると、悲しいことに、Windowsに最適化されてんだなあ社内LANは、と思うことに度々遭遇する。 しかし、もともと多分Linuxが抱えている闇として、Proxy設定がどーも一筋縄ではいかないというだけなのねということ…

やたらChromeのページが落ちるから何だと思ったら、メモリが壊れてた。

しかもどーも一枚目がやられてたからっぽい。 結論を知ってしまうと、「なんだこんなことか」と思うのですが、原因究明には割と苦労しました。 障害分析って、ハード層からOS、アプリ層まで広くあるのでホントフックかけるだけの知識がいるなあ・・・・・・ …

Proxy設定が案外悩ましい。

企業内認証つきProxy(ただし基本的には自動構成スクリプトでプロキシを決定)での事。 SELinux適用などを考えると、細々とした所で設定が必要になる。 よく考えるとそりゃそうで、プロキシ設定を環境変数でやり切ると、そこへ影響させると通信に対して攻撃…

SAS関連の仕事辞めたい。

色々な理由があるが。 所詮米国製品、日本語対応が微妙だという事 もう何年目なんでしょうか。 UTF-8対応ですらロクなもんではないというか、文字操作下手なままだよね。 設計思想が昔のものなのでUTF-8にまだ対応しきってないし、対応予定も不明な事 昔の素…

SASの移行問題アレコレ。

メモ書き。 クロスプラットフォームなのは、「データセット」だけ。 大変残念なお話ではある。 本質的に単なるテキストファイルなのでどうしようもないSASプログラムの問題はおいておくとしても。 非互換なのが、SASカタログ形式も含まれるのが地味に痛い。 …

SASonDemandという名前は、某多分シェア一番ぐらいになるEDCのSASデータセットアウトプット機能の名称とバッティングするので紛らわしいよなと思いつつ、まあどうでもいいアドバイスなど。

ill-identified.hatenablog.com で言及されました。うん、TBやっぱあった方がいいよね、はてなブログ。 まあそれはともかくとして。 半角カタカナはデータとして避けた方がよいです。 SASv8ではエラーになったり出力時にバグが発生したりしました。SAS9にな…

SAS Enterprise Guideの「予期せぬエラー」「SASの実行に失敗」する場合には、落ち着いて、以下の事をチェックしておいてほしい。

少しでも無駄な悩みが減りますように。 こういうトラブルって、人を渡り歩くと本当に大袈裟な話になってくからなあ・・・・・・。 プロファイルを間違えてないか SASサーバに紐付ける形でのEGの設定なのにプロファイルを使わないローカルの設定になっていな…

WORKライブラリをメモリ上に載せる方法。

SSDが安定するのですが。Fusion-IOとかの大容量SSDも出てますし、256GBでも問題ないですし。 メモリだと、大容量メモリに個人用PCだとそれほど対応していないというのもあります。家のマシンだとほぼ16GB積んでいるんですが、これから上になるとレアモノだっ…

統計学とは、最低の学問である。

そう言わざるを得ない。 素人でも振りかざせる「統計」。 「解析」がつくと怯む人も出て来るが、実際の所、大した調査もせず、国家統計で出て来ている数字を適当に組み合わせて「分析」と言う人が多い。 統計モデルが、原理原則に基づいたモデルと勘違いして…

SAS University Editionが、鬼畜な仕様で笑った。

VMのテンプレートで提供とか酷えです。 SAS Studioが悪い、って気はしないですが、 大した工夫もなくただプログラムをWeb経由で登録実行出来はするんだけどさ、 ライセンス料金はともかくとして、どう考えたってシンプルに生SAS使うのに比べてCPUやメモリを…

ドキュメントも開発手法も、正しく開発設計に向かわなければ、手間も時間も掛かる。

という事を延々と言っているのだけどなあ。 某所にて。 設計書作りと設計が乖離し、開発と開発すべき物が乖離し、お客さんと合意すべきものが散逸し、どこから手を付けるか→卓袱台返しやった方が早いだろう、とは常々思っているのだが。 まあ2月ぐらいから言…

今ちょっとメモっときたい事。

SAS Intelligence Platformのインストール周りからの説明作り。 もういい加減説明するのも疲れた・・・・・・

Windows-1252にある文字のUTF-8に変換した時最大で3バイトになる。

タイトル通り。 いわゆるISO-8859-1、通称Latin-1というヤツであるが、これ、Windows上では拡張されWindows-1252というものになっている。 この拡張された部分に埋められた文字が、UTF-8では3バイトになるものがある。ダガーやダブルダガーとか。 shift_JIS…

今更ながら、Windowsのファイル文字列の取り扱いについて。

IBM Windows のファイル名の文字コードについて - Japan があったので、大変有り難い。 ほぼそれの内容なのだけど。 いわゆるUTF-16LEでNTFSでは登録されているのだが、ファイルシステムが違う場合、特にFATとかでは日本標準ではS-JISに変換されるよう。 で…

SASインストールに関するTip幾つか。

多くの人が、「インストーラーに従ってインストールすれば問題ないよね?」的な発想でインストールされると思います。 特に問題がなければそれでだいたいは大丈夫です。間違ってません。 ただ、たまーに問題が発生するのですが、そこら辺を自力解決というに…

他人の性能に振り回されない為の、大局観。

良識ある社会人のみなさんへ-提出物は期限に余裕もって出してください - 攻めは飛車角銀桂守りは金銀三枚gin-kei.hatenablog.com 見て。 まあ、タイトル通りですが。 他人の能力というのは過信してはならず、予定通りに進んでなさげな場合には、マイルスト…

p値はnに影響を受けるものなので。

はてなブックマーク - A/B テストで施策の効果を検証!エンジニアのための R 入門 - クックパッド開発者ブログb.hatena.ne.jp で、ブコメでもちょっとコメントしてますが。 このサンプルサイズでは、検定をしても仕方がない。 まあ、A/Bでそれぞれn=10000み…

SASのバージョンアップはかなりツライ。

まあ、SASに限らずだけど。 SASの資格は大したものは持っていないのだけど、体系だってSASを学んだと言うより鬼のような現状に鍛え上げられたという感じなので、ほぼほぼ大概の事は何とかなるようになってる。 んだけど、流石にSAS/GRAPH周りは普段やってな…

システムは生物です。消費期限があります。

古いシステムを騙し騙し使う、というのは、実際とてもコストがかかる事が多いのですが。 ほぼほぼその辺りの話は全てお話しているハズなんですが、「聞いてない」というお客さんは多いです。 どんなシステムも、バージョンアップで見た目とか挙動とか変わり…

SASインストール時に、アンチウィルスソフトは「絶対に」止めましょう。死ぬほど暇ならいいですが。

SASインストールのお話ですが。 SASのサーバコンポーネント、jarファイル多いんですが、アンチウィルスソフトによって内部をサーチされる時に、異様に時間がかかります。 今の所、インストールに失敗するケースはありませんが、人間が音を上げるくらい時間が…

CentOS on VirtualBox、のスマートな利用方法

という辺りで詰まってますなー。 Proxy Settingはグダグダながら何とか設定した事にした。 GNOMEでのSETTINGもしましたが。 sudoでもENVKEEP設定もしましたが。 結局の所、dconfだったかが、「接続出来ませんねん」みたいなメッセージを出して来る、あの問題…

会社もグループでもやる気がない感じなのが、もうなんてーかな。

コア数とかSSDとかに大して興味はないんですが、ビッグデータ解析にもマイナス評価なんですが、ベイズ解析とかがガンガン出来る環境上で、SAS構築するのはしたいなと思ってはいるんですよね。 今、単純にマシンスペック入れるだけでは性能が大して上がらない…

SASという製品を「1個」買う、という事はまず出来ないので。

SASですが。 「Analytics Pro」であるとか、そういう名前でご指定下さい。マジで。 SAS V8以降、SASのライセンスの呼び方や体系が変わってるんです。 現在、サーバに入れるSASの場合、通常はSAS Enterprise GuideやSAS Studio経由でアクセスするもの、という…

SASでのトランスコーディングあれこれ。

トランスコーディングは、大抵の場合、データセットの別環境への移送も含みます。 ので、そこら辺も絡めてちょっと言及しておきます。 前振りとして。 SASの文字変数は、固定長文字列としてバイト長で定義されています。その為、トランスコーディングに伴う…

XPORTファイルとは何ぞやというお話。

何だか騒がしくなってきた所ですが(超白々しい)、最近話題のSAS transport fileというのを簡単にご説明させて頂きます。 マニュアル(日本語) SAS 9.4 ファイルの移動とアクセス(PDF)をご参照下さい。 もうそこに書いてる事です。 全ての人に言います。 1…

VMWareが面倒臭くなったのでVirtualBoxを試す

VirtualBoxが気にはなってたけど、今までWin7でインストール出来ずに四苦八苦していたけど、とりあえずインストールする方法が見つかったので乗り換えてみる。 Virtual Boxのインストールの要諦。 Windows 7 Professionalではなんでかx32版をインストーラー…