Fault tolerance is a good thing - add some to the migration script
[invirt/scripts/prod-migration.git] / xvm-migrate-machine
old mode 100644 (file)
new mode 100755 (executable)
index d8c729e..9b08eec
-##!/bin/bash
-# Migrates the machine named $1 from the dev cluster.
+#!/usr/bin/python
+# Migrates the machine passed as arguments from the dev cluster.
 # To be run on the prod cluster.
 
-## The present version is NOT A REAL SCRIPT.
-## Things may not even be tested.  Copy and paste.
+from invirt import remctl as r
+from lib import database
+import subprocess
+import sys
 
-## dump from dev db; save info well
+dev_db_uri = 'postgres://sipb-xen@sipb-xen-dev.mit.edu/sipb_xen'
+database.connect(dev_db_uri)
+dev_sess = database.session
 
-#echo "\\a \\t \\\\ select * from machines where name = '$MACHINE';" \
-# | psql -h xvm -U sipb-xen sipb_xen -q
-## 581|fsck|256|price|price|2ab6638f-3f65-2b32-3fd3-c16b74a9b7fe|linux|f|1|price|test|f
-## watch out for funny characters in description; better (non-)quoting needed
-## also disks, nics
+database.connect()
+prod_sess = database.session
 
-## remove from dev db; ideally atomic with dump
+## dump from dev db
+def take_data(machine_name):
+  dev_sess.begin()
+  machine = dev_sess.query(database.Machine).filter_by(name=machine_name).one()
+  
+  # Clean out the ACL just so we don't have to think about it
+  machine.acl = []
+  dev_sess.update(machine)
+  
+  print 'VM Info:'
+  print '  name: %s' % machine.name
+  print '  description: %s' % machine.description
+  print '  cpus: %s' % machine.cpus
+  print '  memory: %s' % machine.memory
+  print '  owner: %s' % machine.owner
+  print '  contact: %s' % machine.contact
+  print '  administrator: %s' % machine.administrator
+  print '  uuid: %s' % machine.uuid
+  print '  type: %s' % machine.type.type_id
+  print '  autorestart: %s' % machine.autorestart
+  print '  adminable: %s' % machine.adminable
+  print '  Disks:'
+  for disk in machine.disks:
+    print '  - %s (%s)' % (disk.guest_device_name, disk.size)
+  print '  NICs:'
+  for nic in machine.nics:
+    print '  - %s, %s, %s' % (nic.mac_addr, nic.ip, nic.hostname)
+  print '==============================================='
+  print
+  
+  disks = machine.disks
+  nics = machine.nics
+  for r in disks + nics + [machine]:
+    dev_sess.delete(r)
+  
+  dev_sess.commit()
+  
+  for r in disks + nics + [machine]:
+    dev_sess.expunge(r)
+    del r._instance_key
+  
+  return machine
 
-## shut down if up
-#remctl remote control $MACHINE destroy
+## add to prod db
+def restore_data(machine, session):
+  # The machine's type is still the one attached to the dev database;
+  # get the right one
+  machine.type = session.query(database.Type).filter_by(type_id=machine.type.type_id).one()
+  session.begin()
+  session.save(machine)
+  session.commit()
+  
+def migrate_vm(machine_name):
+  # Power off the VM on dev
+  #
+  # This has to be done first, because once the machine is deleted
+  # from the database, we can't remctl for it anymore
+  out, err = r.remctl('xvm-remote.mit.edu', 'control', machine_name, 'destroy', err=True)
+  print out
+  
+  machine = take_data(machine_name)
+  
+  success = True
+  ## copy disk image... copy, copy...
+  for disk in machine.disks:
+    lvname='d_%s_%s' % (machine.name, disk.guest_device_name)
+    
+    if 0 != subprocess.call(['lvcreate', '-L%sM' % str(disk.size), '-n', lvname, 'xenvg']):
+      success = False
+    
+    ssh = subprocess.Popen(['ssh', '-o', 'GSSAPIDelegateCredentials=no',
+                'torchwood-institute.mit.edu',
+                'dd', 'if=/dev/xenvg/%s' % lvname, 'bs=1M'],
+                 stdout=subprocess.PIPE)
+    dd = subprocess.Popen(['dd', 'of=/dev/xenvg/%s' % lvname, 'bs=1M'],
+                stdin=ssh.stdout)
+    if 0 != dd.wait():
+      success = False
+    if 0 != ssh.wait():
+      success = False
+  
+  if not success:
+    restore_data(machine, dev_sess)
+    
+    print '==============================================='
+    print 'ERROR: VM %s failed to migrate' % machine.name
+    print '==============================================='
+  else:
+    restore_data(machine, prod_sess)
 
-## copy disk image... copy, copy...
-## for each disk:
-lvname="d_${MACHINE}_${guest_device_name}"
-lvcreate xenvg -n "$lvname" -L "${size}"M
-ssh t-i dd if=/dev/xenvg/"$lvname" of=/dev/stdout bs=1M \
- | dd if=/dev/stdin of=/dev/xenvg/"$lvname" bs=1M
-
-## add to dev db
-
-## power on if desired
+if __name__ == '__main__':
+  for vm in sys.argv[1:]:
+    print '==============================================='
+    print 'Migrating %s' % vm
+    print '==============================================='
+    migrate_vm(vm.strip())